Практикум 9

Отчет по парктикуму 9

Глобальное парное выравнивание гомологичных белков

При помощи программы infoseq на сервере kodomo я загрузил списки идентификаторов всех аннотированных записей белков E. coli (штамм K12) и Bacillus subtilis (штамм 168).

        
  infoseq 'sw:*_ECOLI' -only -name -nohead -out ecoli.txt
  infoseq 'sw:*_BACSU' -only -name -nohead -out bacsu.txt
        
    

При помощи Google Таблиц я определил пары белков, имеющих одинаковую мнемонику функции и выбрал из них 3 пары для выравнивания. Электронная таблица доступна по ссылке.

Далее я выполнил попарные глобальные выравнивания последовательностей выбранных белков программой needle с параметрами по умолчанию. Результаты представлены в табл. 1.

Табл. 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Argininosuccinate synthase ASSY_ECOLI ASSY_BACSU 369.5 25.6% 43.2% 94 20
Flagellar biosynthetic protein FliP FLIP_ECOLI FLIP_BACSU 572.0 46.9% 62.9% 24 3
UDP-glucose 4-epimerase GALE_ECOLI GALE_BACSU 1032.0 56.8% 70.6% 3 2

Локальное парное выравнивание гомологичных белков

Для тех же пар белков я выполнил локальное выравнивание при помощи программы water (также с параметрами по умолчанию). Результаты представлены в табл. 2.

Табл. 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Argininosuccinate synthase ASSY_ECOLI ASSY_BACSU 375.5 28.4% 47.3% 56 18 89.3% 95.0%
Flagellar biosynthetic protein FliP FLIP_ECOLI FLIP_BACSU 578.0 54.6% 72.2% 0 0 83.7% 92.8%
UDP-glucose 4-epimerase GALE_ECOLI GALE_BACSU 1033.0 57.4% 71.4% 1 1 99.4% 98.8%

Результат применения программ выравнивания к неродственным белкам

Для последовательностй двух случайно выбранных белков E. coli и B. subtilisс разными мнемониками функции при помощи программ needle и water я выполнил глобальное и локальное выравнивания. Результаты приведены в табл. 3 и 4.

Табл. 3. Характеристики глобального парного выравнивания неродственных белков
Protein 1 Name Protein 2 Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Protein TraP Nitrate transporter TRAP_ECOLI NASA_BACSU 14.5 9.5% 17.8% 269 14

По сравнению с оптимальными глобальными выравниваниями последовательностей гомологов, у оптимального глобального выравнивания последовательностей неродственных белков наблюдается крайне низкий вес (score), очень низки также проценты идентичности и схожести. В то же время, сильно увеличено число гэпов (в моем случае гэпы составляют более половины длины выравнивания). Количество инделей оказалось меньше, чем в одном из оптимальных выравниваний гомологов, хотя и заметно больше, чем в двух других случаях. По-видимому, только по числу инделей в оптимальном выравнивании сделать вывод о наличии или отсутствии гомологии в общем случае нельзя.

Табл. 4. Характеристики локального парного выравнивания неродственных белков
Protein 1 Name Protein 2 Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Protein TraP Nitrate transporter TRAP_ECOLI NASA_BACSU 36.5 21.0% 30.6% 26 1 18.4% 15.5%

В случае парного локального выравнивания неродственных белков вес, также значительно ниже, чем в случае гомологов. Само локальное выравнивание оказывается довольно коротким, намного короче, чем в случае локального выравнивания гомологов. Это отражается в значительно меньшем проценте покрытия последовательностей выравниванием. По количеству гэпов и инделей локальное выравнивание неродственных последовательностей белков не сильно отличается от локального выравнивания гомологов. Хотя идентичность превышает 20%, малая длина выравнивания и низкие проценты покрытия не позволяют сделать вывод о родстве, на таких коротких участках сходство может быть обусловлено случайными причинами.

Множественное выравнивание белков

Для множественного выравнивания я выбрал белок с мнемоникой ASSY (рекомедованное полное имя белка Argininosuccinate synthase). В UniProt по запросу mnemonic:assy_* нашлось 613 результатов. Были использованы белки с идентификаторами: ASSY_HUMAN, ASSY_YEAST, ASSY_ARATH, ASSY_XENLA, ASSY_DROME, ASSY_ECOLI, ASSY_BACSU.

Для выравнивания я использовал программу muscle с параметрами по умолчанию через Jalview, следуя инструкции в подсказках к практикуму (второй способ). Выравнивание (в формате проекта Jalview) доступно по ссылке

Несмотря на то, что белки были взяты у далеких с точки зрения эволюции организмов (человека, лягушки, рыбы, дрожжей, цветкового растения, грамотрицательной и грамположительной бактерий), последовательности выровнялись хорошо, обнаружилось много консервативных участков небольшой длины, разделенных короткими неконсервативными фрагментами. Наиболее заметны участки, содержащие идентичные или похожие аминокислоты, находящиеся в столбцах 99-133, 186-229, 359-395. Наибольшая вариабельность наблюдается на концах последовательностей. Последовательность белка, принадлежащего Arabidopsis thaliana, на концах выравнивания сильно отличается от всех прочих, но, поскольку она проявляет сходство с остальными последовательностями на консервативных участках, я думаю, что она все же родственна всем остальным последовательностям в выравнивании.