Алгоритмы выравнивания

Задание 1. Сравнение выравниваний последовательностей гомологичных и негомологичных белков.

Для выполнения заданий были выбраны по пять пар гомологичных и негомологичных белков и для каждой пары сделано глобальное и локальное выравнивание. Полученные данные (вес выравнивания, идентичность, схожесть, количество гэпов и инделей, а также процент покрытия) занесены в таблицу, которую можно скачать здесь. Понятно, что трудно судить о закономерностях выравниваний гомологичных белков при такой маленькой выборке, но некая логика уже видна.

Таким образом, только по совокупности показателей можно сделать вывод о том, гомологичны ли данные белки. Если процент идентичности больше 30%, схожести больше 50%, количество гэпов (не больше 30) и инделей не велико (особенно в глобальном), а процент покрытия в локальном около 90%, то, скорее всего, данные белки гомологичны.

Задание 2. Множественное выравнивание.

В качестве белка был взят актин-1, а организмы были выбраны следующие: Daucus carota (из отдела Цветковые растения), Schizophyllum commune (отдел Базидиомицеты), Plasmodium berghei (Apicomplexa), Acanthamoeba castellanii (класс Discosea), Podocoryna carnea (тип Cnidaria), Schistosoma mansoni (тип Плоские черви), Trypanosoma brucei brucei (тип Эвгленозои). Белки были загружены в программу Jalview, где с помощью команды muscle with defaults было построено выравнивание, которое можно скачать здесь, а посмотреть на рисунке 1.

Множественное выравнивание
Рисунок 1. Множественное выравнивание белка ACT1 Можно заметить, что этот белок высоко консервативен и очень распространен, так как встречается у разных типов организмов. Это неудивительно, так как актины - это белки, которые учавствуют в различных типах клеточной подвижности, поэтому экспрессируются во многих эукариотических клетках.

Далее были выбраны два белка, наиболее удаленные друг от друга. Ими оказались белки из Daucus carota и Trypanosoma brucei brucei. Только их выравнивание можно увидеть в этом файле. При построении глобального и локального выравнивания оказалось, что они полностью идентичны, что объясняется большой схожестью этих белков.

Сравнение
Рисунок 2. Сравнение множественного выравнивания с глобальным. На данном рисунке результат множественного выравнивания - это первые две строки, тогда как глобальное выравнивание - это две нижние строки. Мы видим различие во втором выравнивании на первой и четвертой позиции. В множественном выравнивании у второй последовательности на первой позиции стоит гэп, тогда как в глобальном выравнивании - метионин. В четвертой позиции наоборот - делеция при гомологичном выравнивании.
Сравнение
Рисунок 3. Сравнение множественного выравнивания с глобальным. На данном рисунке результат множественного выравнивания - это первые две строки, тогда как глобальное выравнивание - это две нижние строки. Мы видим различие во втором выравнивании на 230 (делеция аминокислоты во второй последовательности при глобальном выравнивании) и 238 (делеция аминокислоты при множественном) позиции. Тоже самое только у первой последовательности повторяется на позициях 273 и 274.