Было взято множественное выравнивание aln_11.fasta. Из него было получено парное выравнивание двух последних последовательностей (рис.1) путём удаления остальных.
Рисунок 1. Парное выравнивание
На рис.2 показано глобальное выравнивание этих последовательностей полученное при помощи программы needle (gap opening penalty 10.0, gap extension penalty 0.5). Скачать файл needle можно по этой ссылке.
Рисунок 2. Выравнивание needle
Наилучшее локальное выравнивание, полученное с помощью программы water (gap opening penalty 10.0, gap extension penalty 0.5) показано на рис.3. Скачать файл water можно по этой ссылке.
Рисунок 3. Выравнивание water
Также были взяты два заведомо негомологичных белка (идентификаторы A3CUL0_METMJ и D8HXL8_AMYMU). Выравнивания этих белков при помощи needle и water показаны на рис.4 и рис.5 соответственно. Скачать файл needle и файл water можно по этой и этой ссылке.
Рисунок 4. Выравнивание needle для негомологичных белков
Рисунок 5. Выравнивание water для негомологичных белков
Параметры выравниваний представлены в табл.1.
Тип выравнивания | Длина | Число и процент совпадений | Число и процент сходных остатков | Число и процент гэпов | Число открытий гэпов |
Парное выравнивание, выделенное из множественного выравнвиания | 138 | 34, 24.6% | 19, 13.7% | 32, 23.18% | 3 |
Глобальное выравнвиание | 140 | 31, 22.1% | 49, 35.0% | 42, 30.0% | 6 |
Локальное выравнивание | 120 | 31, 25.8% | 49, 40.8% | 24, 20.0% | 3 |
Глобальное выравнивание заведомо негомологичных последовательностей | 399 | 41, 10.3% | 60, 15.0% | 285, 71.4% | 11 |
Локальное выравнивание заведомо негомологичных последовательностей | 168 | 39, 23.2% | 59, 35.1% | 57, 33.9% | 7 |
Если сравнивать выравнивание, полученное из множественного, и выравнивание с помощью needle, то видно, что во втором число совпадений немного меньше, но число сходных остатков значительно больше чем в первом, хотя и число гэпов тоже больше. Возможно первое выравнивание является более правдободобным, т.к. в изначальном множественном выравнивании устанавливалось сходство между несколькими последовательностями одновременно и совпадающие участки являются в действительности гомологичными.
Участок различия между выравниванием, полученным из множественного, и выравниванием needle показан на рис.6. Изображение включает по пять совпадающих колонок с каждого из концов от участка с различиями.
Рисунок 6. Участок различия между выравниваниями, координаты 101-110, число различающихся колонок - 8.
Была проверенна правильность выравниваний с помощью программ SupCheck и RasMol путём сравнения с совмещением пространственных структур белков. В результате не было выявлено ошибок для выравнивания, полученного из множественного, но для выравнивания, выполненного при помощи needle, было найдено 27 ошибок первого рода (предположительно гомологичные пары C-α атомов отмечены "+", но в структуре не совмещаются) и 20 ошибок второго рода (C-α атомы двух остатков хорошо совмещаются, но соответствующие буквы либо не находятся в одной колонке, либо в одной колонке, но колонка не отмечена "+"). Сравнение двух выравниваний показано на рис.7.
Рисунок 7. Сравнение полученных выравниваний с совмещением пространственных структур белков. Первые две строчки сверху - выравнивание, взятое из множественного, второя и третья - выравнивание needle. "+" в строках Correct alignment I и Correct alignment II (для первого и второго выравниваний соответственно) обозначают колонки, которые были оценены мной как достоверные. Символом "S" в строке Structural alignment помечены колонки, которые соответствуют совмещению пространственных структур.
Скачать проект JalView можно по этой ссылке.