Результаты выполнения практикума находятся в таблице (скачать).
Выравнивания строятся при помощи диамических алгоритмов.
Их суть, на мой взгляд, отлично описывается цитатой Кьеркегора:
"It is perfectly true, <,
that life must be understood backwards. But < it must be lived forwards".
Глобальные выравнивания были построены при помощи утилиты needle,
использующей алгоритм Нидлмана Вунша. Локальные - water, использующей алгоритм
Смита-Ватермана. Для того, чтобы лучше разобраться в алгоритме Смита-Ватермана,
я решила его написать (посмотреть код).
Получилось с переменным успехом, но, надеюсь, что работает более-менее.
С алгоритмом Ниддлмана-Вунша он расходится по 3 моментам:
в последнем первая колонка и столбец иницилизируются штрафами за гэпы, а не нулями, scores могут быть отрицатлельными, а также обратный ход алгоритма начинается с крайней правой нижней ячейки и заканчивается на крайней левой ячейке
Гомологичные и негомологичные белки
Все показатели, указывающие на совпадающие последовательности,
очевидно выше для гомологичных белков.
А именно выше score, similarity (важно, что в таблице
есть сравнение SPREE_ECOLI и NBSN2_BASCU, которое дало
similarity, равное 70, но при этом очень маленькое покрытие),
identity. По абсолютному числу гэпов сложно судить о результатах выравнивания,
так как этот показатель также зависит от длины белка.
Устанавливать точный порог гомологичности мне не кажется уместным,
потому что 1) моя выборка мала, 2) маловероятно, и не факт, но я могла обнаружить пары гомологичных
белков среди тех, кого при выполнении практикума считала негомологичными. В целом он
колеблется в районе 40-50 процентов.
Важно, что локальное выравнивание даёт более схожие между собой результаты для
гомологичных и не гомологичных белков, чем глобальное. Поэтому для выявления гомологии лучше
использовать именно глобальное выравнивание.
Множественное выравнивание
Для множественного выравнивания мною был выбран прион, потому что
есть интересная статья про эволюцию прионов в клеточной культуре [1],
и, хотя она не особо касается темы практикума, он показался мне интересным объектом.
(upd: увидела, что с выбором прионов я очень "оригинальна", прошу прощения, не знала).
Глобальное множественное выравнивание - проект
Сравнение выравниваний, полученных из множественного - проект
из множественного выравнивания
из глобального выравнивания
из локального выравнивания
Показан различающийся участок. Важная пометка: на верхнем изображении последовательности поменялись местами.
Последовательность белка овцебыка расположена выше таковой для человека, в отличие от двух нижних изображений. Различий между глобальным и локальным выравниваниями мною найдено не было.
Множественное выравнивание показывает несколько гэпов, которые расположены друг под другом,
но это не удивительно, если помнить, что сначала оно было истинно множественным.
В остальном различия незначительны и возникают из-за того, что множественное
выравнивание смещается на выявление консервативных остатков.
[1] Jiali Li, Shawn Browning, Darwinian Evolution of Prions in Cell Culture, Science. 2010 Feb 12; 327(5967): 869–872