Предсказание парных выравниваний

Предсказание парных выравниваний

Было взято множественное выравнивание aln_11.fasta. Из него было получено парное выравнивание двух последних последовательностей (рис.1) путём удаления остальных.

Рисунок 1. Парное выравнивание

На рис.2 показано глобальное выравнивание этих последовательностей полученное при помощи программы needle (gap opening penalty 10.0, gap extension penalty 0.5). Скачать файл needle можно по этой ссылке.

Рисунок 2. Выравнивание needle

Наилучшее локальное выравнивание, полученное с помощью программы water (gap opening penalty 10.0, gap extension penalty 0.5) показано на рис.3. Скачать файл water можно по этой ссылке.

Рисунок 3. Выравнивание water

Также были взяты два заведомо негомологичных белка (идентификаторы A3CUL0_METMJ и D8HXL8_AMYMU). Выравнивания этих белков при помощи needle и water показаны на рис.4 и рис.5 соответственно. Скачать файл needle и файл water можно по этой и этой ссылке.

Рисунок 4. Выравнивание needle для негомологичных белков

Рисунок 5. Выравнивание water для негомологичных белков

Параметры выравниваний представлены в табл.1.

Таблица 1. Сравнение различных выравниваний
Тип выравнивания Длина Число и процент совпадений Число и процент сходных остатков Число и процент гэпов Число открытий гэпов
Парное выравнивание, выделенное из множественного выравнвиания 138 34, 24.6% 19, 13.7% 32, 23.18% 3
Глобальное выравнвиание 140 31, 22.1% 49, 35.0% 42, 30.0% 6
Локальное выравнивание 120 31, 25.8% 49, 40.8% 24, 20.0% 3
Глобальное выравнивание заведомо негомологичных последовательностей 399 41, 10.3% 60, 15.0% 285, 71.4% 11
Локальное выравнивание заведомо негомологичных последовательностей 168 39, 23.2% 59, 35.1% 57, 33.9% 7

Если сравнивать выравнивание, полученное из множественного, и выравнивание с помощью needle, то видно, что во втором число совпадений немного меньше, но число сходных остатков значительно больше чем в первом, хотя и число гэпов тоже больше. Возможно первое выравнивание является более правдободобным, т.к. в изначальном множественном выравнивании устанавливалось сходство между несколькими последовательностями одновременно и совпадающие участки являются в действительности гомологичными.

Участок различия между выравниванием, полученным из множественного, и выравниванием needle показан на рис.6. Изображение включает по пять совпадающих колонок с каждого из концов от участка с различиями.

Рисунок 6. Участок различия между выравниваниями, координаты 101-110, число различающихся колонок - 8.

Была проверенна правильность выравниваний с помощью программ SupCheck и RasMol путём сравнения с совмещением пространственных структур белков. В результате не было выявлено ошибок для выравнивания, полученного из множественного, но для выравнивания, выполненного при помощи needle, было найдено 27 ошибок первого рода (предположительно гомологичные пары C-α атомов отмечены "+", но в структуре не совмещаются) и 20 ошибок второго рода (C-α атомы двух остатков хорошо совмещаются, но соответствующие буквы либо не находятся в одной колонке, либо в одной колонке, но колонка не отмечена "+"). Сравнение двух выравниваний показано на рис.7.

Рисунок 7. Сравнение полученных выравниваний с совмещением пространственных структур белков. Первые две строчки сверху - выравнивание, взятое из множественного, второя и третья - выравнивание needle. "+" в строках Correct alignment I и Correct alignment II (для первого и второго выравниваний соответственно) обозначают колонки, которые были оценены мной как достоверные. Символом "S" в строке Structural alignment помечены колонки, которые соответствуют совмещению пространственных структур.

Скачать проект JalView можно по этой ссылке.

© Gordeev Anton
Дата последнего изменения 25.12.2013