Предсказание парных выравниваний


сайт ФББ

сайт МГУ

Получение парного выравнивания

Для работы было выбрано множественное выравнивание aln_10, из которого с помощью delete были убраны все последовательности, кроме двух последних, и оставшиеся лишние гэпы.

Построение локального и глобального выравниваний

По принципу алгоритма построения выравнивания делятся на локальные и глобальные. Алгоритм построения глобальных выравниваний основан на поиске различий в изначально сходных, гомологичных, последовательностях, алгоритм построения локальных - на поиске сходных участков в последовательностях непохожих. Для полученных в предыдущем пункте последовательностей были построены глобальное выравнивание по алгоритму Нидлмана-Вунша (программа needle пакета EMBOSS) и локальное выравнивание по алгоритму Смита-Ватермана (программа water пакета EMBOSS).

Построение локального и глобального выравниваний заведомо негомологичных последовательностей

Для этого задания были выбраны последовательности НАД-зависимой ДНК-лигазы, с которой я работала в более ранних практикумах, и Bontoxilysin A, с которой работает Александр Злобин.

Сравнение выравниваний

Таблица 1. Параметры построенных выравниваний

Выравнивание

Длина (число колонок)

Число и процент совпадений

Число и процент сходных остатков (Similarity)

Число и процент гэпов

Число открытий гэпов

Исходное парное выравнивание

144

44 (30.6%)

62 (43.1%)

17 (11.8%)

7

Глобальное выравнивание

159

50 (31.4%)

65 (40.9%)

47 (29.6%)

8

Локальное выравнивание

151

50 (33.1%)

65 (43.0%)

42 (27.8%)

7

Глобальное выравнивание негомологичных последовательностей

1390

134 (9.6%)

266 (19.1%)

832 (59.9%)

40

Локальное выравнивание негомологичных последовательностей

677

125 (18.5%)

239 (35.3%)

177 (26.1%)

34

Из таблицы 1 видно, что первые три выравнивания, в общем, схожи. Это можно объяснить гомологией сравниваемых последовательностей (за это говорит еще и малая доля гэпов в выравниваниях, высокий процент сходных остатков). Выравнивания негомологичных последовательностей отличаются сильно. Видно, что глобальное гораздо хуже локального: в нем намного больше гэпов, намного меньше процент сходных остатков. Неудивительно, ведь алгоритм Нидлмана-Вунша предназначен для гомологичных последовательносей, коими сравниваемые не являются.

Различия исходного и глобального выравниваний

В JalView я выровняла два выравнивания относительно друг друга. Выравнивания сильно различаются, одинаково последовательности вырaвняны одинаково в начале и в конце: на позициях 1-56 и 107-161.

Различия выравниваний

Рис. 1. Участок, на котором два выравнивания различаются

Возможно, иной подход к выравниванию этих двух последовательностей в глобальном выравнивании объясняется введенными мной высоким штрафом за открытие гэпа и низким - за продолжение цепочки гэпов. Это хорошо объясняет то, что в глобальном выравнивании гэпы более "скучены".

Проверка правильности выравниваний

С помощью программ SupCheck и RasMol исходное и построенное глобальное выравнивания были проверены на достоверность. В проекте знаком "+" отмечались колонки, в которых можно предположить гомологию остатков, а "S" - колонки, соответствующие которым остатки хорошо совмещаются на трехмерном совмещении цепей. Если колонка отмечена только "+" или только "S" то это ошибка. Ошибки посчитаны ниже.

  • Исходное выравнивание

Ошибки I-го рода (Сα-атомы, соответствующие отмеченным "+" колонкам, в структуре не совмещаются): 7

Ошибки II-го рода (Сα-атомы, соответствующие не отмеченным "+" колонкам, в структуре совмещаются): 39

  • Глобальное выравнивание

Ошибки I-го рода: 13

Ошибки II-го рода: 35

Суммарное количество ошибок отличается на единицу, значит, выравнивания примерно одного качества.

© Дарья Горбачева

изменено 8.08.2014