Отчет по парктикуму 9
Глобальное парное выравнивание гомологичных белков
При помощи программы infoseq на сервере kodomo я загрузил списки идентификаторов всех аннотированных записей белков E. coli (штамм K12) и Bacillus subtilis (штамм 168).
infoseq 'sw:*_ECOLI' -only -name -nohead -out ecoli.txt
infoseq 'sw:*_BACSU' -only -name -nohead -out bacsu.txt
При помощи Google Таблиц я определил пары белков, имеющих одинаковую мнемонику функции и выбрал из них 3 пары для выравнивания. Электронная таблица доступна по ссылке.
Далее я выполнил попарные глобальные выравнивания последовательностей выбранных белков программой needle с параметрами по умолчанию. Результаты представлены в табл. 1.
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
Argininosuccinate synthase | ASSY_ECOLI | ASSY_BACSU | 369.5 | 25.6% | 43.2% | 94 | 20 |
Flagellar biosynthetic protein FliP | FLIP_ECOLI | FLIP_BACSU | 572.0 | 46.9% | 62.9% | 24 | 3 |
UDP-glucose 4-epimerase | GALE_ECOLI | GALE_BACSU | 1032.0 | 56.8% | 70.6% | 3 | 2 |
Локальное парное выравнивание гомологичных белков
Для тех же пар белков я выполнил локальное выравнивание при помощи программы water (также с параметрами по умолчанию). Результаты представлены в табл. 2.
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
Argininosuccinate synthase | ASSY_ECOLI | ASSY_BACSU | 375.5 | 28.4% | 47.3% | 56 | 18 | 89.3% | 95.0% |
Flagellar biosynthetic protein FliP | FLIP_ECOLI | FLIP_BACSU | 578.0 | 54.6% | 72.2% | 0 | 0 | 83.7% | 92.8% |
UDP-glucose 4-epimerase | GALE_ECOLI | GALE_BACSU | 1033.0 | 57.4% | 71.4% | 1 | 1 | 99.4% | 98.8% |
Результат применения программ выравнивания к неродственным белкам
Для последовательностй двух случайно выбранных белков E. coli и B. subtilisс разными мнемониками функции при помощи программ needle и water я выполнил глобальное и локальное выравнивания. Результаты приведены в табл. 3 и 4.
Protein 1 Name | Protein 2 Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
Protein TraP | Nitrate transporter | TRAP_ECOLI | NASA_BACSU | 14.5 | 9.5% | 17.8% | 269 | 14 |
По сравнению с оптимальными глобальными выравниваниями последовательностей гомологов, у оптимального глобального выравнивания последовательностей неродственных белков наблюдается крайне низкий вес (score), очень низки также проценты идентичности и схожести. В то же время, сильно увеличено число гэпов (в моем случае гэпы составляют более половины длины выравнивания). Количество инделей оказалось меньше, чем в одном из оптимальных выравниваний гомологов, хотя и заметно больше, чем в двух других случаях. По-видимому, только по числу инделей в оптимальном выравнивании сделать вывод о наличии или отсутствии гомологии в общем случае нельзя.
Protein 1 Name | Protein 2 Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
Protein TraP | Nitrate transporter | TRAP_ECOLI | NASA_BACSU | 36.5 | 21.0% | 30.6% | 26 | 1 | 18.4% | 15.5% |
В случае парного локального выравнивания неродственных белков вес, также значительно ниже, чем в случае гомологов. Само локальное выравнивание оказывается довольно коротким, намного короче, чем в случае локального выравнивания гомологов. Это отражается в значительно меньшем проценте покрытия последовательностей выравниванием. По количеству гэпов и инделей локальное выравнивание неродственных последовательностей белков не сильно отличается от локального выравнивания гомологов. Хотя идентичность превышает 20%, малая длина выравнивания и низкие проценты покрытия не позволяют сделать вывод о родстве, на таких коротких участках сходство может быть обусловлено случайными причинами.
Множественное выравнивание белков
Для множественного выравнивания я выбрал белок с мнемоникой ASSY (рекомедованное полное имя белка Argininosuccinate synthase). В UniProt по запросу mnemonic:assy_* нашлось 613 результатов. Были использованы белки с идентификаторами: ASSY_HUMAN, ASSY_YEAST, ASSY_ARATH, ASSY_XENLA, ASSY_DROME, ASSY_ECOLI, ASSY_BACSU.
Для выравнивания я использовал программу muscle с параметрами по умолчанию через Jalview, следуя инструкции в подсказках к практикуму (второй способ). Выравнивание (в формате проекта Jalview) доступно по ссылке
Несмотря на то, что белки были взяты у далеких с точки зрения эволюции организмов (человека, лягушки, рыбы, дрожжей, цветкового растения, грамотрицательной и грамположительной бактерий), последовательности выровнялись хорошо, обнаружилось много консервативных участков небольшой длины, разделенных короткими неконсервативными фрагментами. Наиболее заметны участки, содержащие идентичные или похожие аминокислоты, находящиеся в столбцах 99-133, 186-229, 359-395. Наибольшая вариабельность наблюдается на концах последовательностей. Последовательность белка, принадлежащего Arabidopsis thaliana, на концах выравнивания сильно отличается от всех прочих, но, поскольку она проявляет сходство с остальными последовательностями на консервативных участках, я думаю, что она все же родственна всем остальным последовательностям в выравнивании.