Алгоритмы выравнивания
Задание 1. Сравнение выравниваний последовательностей гомологичных и негомологичных белков.
Для выполнения заданий были выбраны по пять пар гомологичных и негомологичных белков и для каждой пары сделано глобальное и локальное выравнивание. Полученные данные (вес выравнивания, идентичность, схожесть, количество гэпов и инделей, а также процент покрытия) занесены в таблицу, которую можно скачать здесь. Понятно, что трудно судить о закономерностях выравниваний гомологичных белков при такой маленькой выборке, но некая логика уже видна.
- Вес гомологичных последовательностей намного выше у гомологичных белков, причем у последних также вес глобального и локального выравнивания практически не отличается. По полученным данным можно сказать, что белки могут быть гомологичны, начиная с 30 процентов идентичности. Но тут важно судить о гомологичности, принимая во внимания и другие параметры.
- Другое существенное различие - процент покрытия между белками при локальном выравнивании. У гомологичных белков этот показатель находится в пределах 90%, тогда как у негомологичных он очень низкий и не превышает 50%.
- Среди негомологичных пар белков больше процент идентичности и схожести у белков, выполняющих примерно одинаковую функцию. Количество гэпов в гомологичном выравнивании намного превышает их число в локальном, что связано с тем, что выравниваются конечные аминокислоты одного белка с начальными другого. Количество инделей не кардинально разное у гомологичных и негомологичных белков.
Таким образом, только по совокупности показателей можно сделать вывод о том, гомологичны ли данные белки. Если процент идентичности больше 30%, схожести больше 50%, количество гэпов (не больше 30) и инделей не велико (особенно в глобальном), а процент покрытия в локальном около 90%, то, скорее всего, данные белки гомологичны.
Задание 2. Множественное выравнивание.
В качестве белка был взят актин-1, а организмы были выбраны следующие: Daucus carota (из отдела Цветковые растения), Schizophyllum commune (отдел Базидиомицеты), Plasmodium berghei (Apicomplexa), Acanthamoeba castellanii (класс Discosea), Podocoryna carnea (тип Cnidaria), Schistosoma mansoni (тип Плоские черви), Trypanosoma brucei brucei (тип Эвгленозои). Белки были загружены в программу Jalview, где с помощью команды muscle with defaults было построено выравнивание, которое можно скачать здесь, а посмотреть на рисунке 1.
![Множественное выравнивание](act11.png)
Далее были выбраны два белка, наиболее удаленные друг от друга. Ими оказались белки из Daucus carota и Trypanosoma brucei brucei. Только их выравнивание можно увидеть в этом файле. При построении глобального и локального выравнивания оказалось, что они полностью идентичны, что объясняется большой схожестью этих белков.
![Сравнение](cgm_act1.png)
![Сравнение](cmg2_act1.png)