Отчёт по практической работе №8

Поиск гомологичных белков по паттерну

Для анализа были выбраны белки с мнемоникой SRP54 - Signal recognition particle 54 kDa protein. Это белки, распознающие гидрофобный сигнальный мотив в последовательности различных белков. Когда при синтезе белка этот мотив выходит из рибосомы, SRP54 связывает его. Образовавшийся комплекс направляется к цитоплазматической мембранне и с помощью FtsY и Sec белок с распознаваемым мотивом встраивается в мембрану.

Файл, по которому проводился поиск, содержал 27 записей с данной мнемоникой.

Для поиска консервативного участка, по которому можно было бы искать белки с такой же функцией, были выбраны 10 последовательностей из Swiss-Prot: SRP54_ECOLI (E. coli), SRP54_THEAQ (Thermus aquaticus), SRP54_MYCLE (Mycobacterium leprae), SRP54_AQUAE (Aquifex aeolicus), SRP54_BACSU (Bacillus subtilis), SRP54_MYCPN (Mycoplasma pneumoniae), SRP54_MYCTO (Mycobacterium tuberculosis), SRP54_RICBR (Rickettsia bellii), SRP54_BUCAP (Buchnera aphidicola), SRP54_METMA (Methanosarcina mazei). Данные последовательности были выровнены с помощью программы MAFFT. С построенным выравниванием можно ознакомиться здесь. Паттерн был построен по позициям выравнивания, соответствующим 107-120 позициям последовательности SRP54_ECOLI (см. рис. 1). Полученный паттерн:
G-L-Q-G-[ASTV]-G-K-T-T-[STLA]-[VAISCL]-[GAV]-K-[LI]

Рис. 1 Для построения паттерна были выбраны позиции 111-124 выравнивания. Колонки 115 и 120-122 вариативны

Для поиска по построенному паттерну среди бактериальных белков из Swiss-prot использовалась программа fuzzpro:

fuzzpro -sequence "/P/y24/term4/bacteria-sw.fasta" -pattern "G-L-Q-G-[ASTV]-G-K-T-T-[STLA]-[VAISCL]-[GAV]-K-[LI]" -outfile "srp_report.fuzzpro"

В итоге по данному паттерну было найдено 16 белков, все с мнемоникой SRP54. Это означает, что наш паттерн слишком строг. Скорее всего это связано с тем, что в 10 выбранных последовательностях не представлены все варианты аминокислот, которые могут находиться в неконсервативных позициях мотива. Для ослабления паттерна обозначим вариативные позиции как "x" (то есть разрешим в этих участках появляться любым аминокислотам):

fuzzpro -sequence "/P/y24/term4/bacteria-sw.fasta" -pattern "G-L-Q-G-x-G-K-T-T-x-x-x-K-x" -outfile "srp_report.fuzzpro"

С этим паттерном удалось найти 27 последовательностей, все они - с мнемоникой SRP54. Это все последовательности с данной мнемоникой, присутствующие в референсном файле. Таким образом, можно сделать вывод, что участок, выбранный для построения паттерна, специфичен для бактериальных белков SRP54 и, вероятно, важен для выполнения белком его функций, т.к. консервативен у всех белков SRP54, последовательности которых присутствуют в Swiss-Prot.