Алгоритмы выравнивания

Результаты выполнения практикума находятся в таблице (скачать). Выравнивания строятся при помощи диамических алгоритмов. Их суть, на мой взгляд, отлично описывается цитатой Кьеркегора: "It is perfectly true, <, that life must be understood backwards. But < it must be lived forwards".
Глобальные выравнивания были построены при помощи утилиты needle, использующей алгоритм Нидлмана Вунша. Локальные - water, использующей алгоритм Смита-Ватермана. Для того, чтобы лучше разобраться в алгоритме Смита-Ватермана, я решила его написать (посмотреть код). Получилось с переменным успехом, но, надеюсь, что работает более-менее. С алгоритмом Ниддлмана-Вунша он расходится по 3 моментам: в последнем первая колонка и столбец иницилизируются штрафами за гэпы, а не нулями, scores могут быть отрицатлельными, а также обратный ход алгоритма начинается с крайней правой нижней ячейки и заканчивается на крайней левой ячейке

Гомологичные и негомологичные белки
Все показатели, указывающие на совпадающие последовательности, очевидно выше для гомологичных белков. А именно выше score, similarity (важно, что в таблице есть сравнение SPREE_ECOLI и NBSN2_BASCU, которое дало similarity, равное 70, но при этом очень маленькое покрытие), identity. По абсолютному числу гэпов сложно судить о результатах выравнивания, так как этот показатель также зависит от длины белка. Устанавливать точный порог гомологичности мне не кажется уместным, потому что 1) моя выборка мала, 2) маловероятно, и не факт, но я могла обнаружить пары гомологичных белков среди тех, кого при выполнении практикума считала негомологичными. В целом он колеблется в районе 40-50 процентов. Важно, что локальное выравнивание даёт более схожие между собой результаты для гомологичных и не гомологичных белков, чем глобальное. Поэтому для выявления гомологии лучше использовать именно глобальное выравнивание.

Множественное выравнивание
Для множественного выравнивания мною был выбран прион, потому что есть интересная статья про эволюцию прионов в клеточной культуре [1], и, хотя она не особо касается темы практикума, он показался мне интересным объектом. (upd: увидела, что с выбором прионов я очень "оригинальна", прошу прощения, не знала).
Глобальное множественное выравнивание - проект
Сравнение выравниваний, полученных из множественного - проект
prac img из множественного выравнивания
prac img из глобального выравнивания
prac img из локального выравнивания

Показан различающийся участок. Важная пометка: на верхнем изображении последовательности поменялись местами. Последовательность белка овцебыка расположена выше таковой для человека, в отличие от двух нижних изображений. Различий между глобальным и локальным выравниваниями мною найдено не было. Множественное выравнивание показывает несколько гэпов, которые расположены друг под другом, но это не удивительно, если помнить, что сначала оно было истинно множественным. В остальном различия незначительны и возникают из-за того, что множественное выравнивание смещается на выявление консервативных остатков.

[1] Jiali Li, Shawn Browning, Darwinian Evolution of Prions in Cell Culture, Science. 2010 Feb 12; 327(5967): 869–872