Парное выравнивание
Из предложенных выравниваний мною было выбрано alg_11.fa. Скачать его можно по этой ссылке.
На рис.1 приведен вид множественного выравнивнаия при раскраске BLOSUM62 и консервативности > 70%. Необходимо было в новом окне оставить только последние две последовательности, удалив все пустые блоки.Скачать файл проекта в формате .jar можно по этой ссылке.
Рис. 1. Вид множественного выравнивания
На рис. 2 приведено полученное парное выравнивание (рис. 2)
Рис. 2. Парное выравнивание вручную.
Далее было построено глобальное выравнивание, используя две последние последовательности из выравнивания и программу needle. (см. рис. 3.). Файл в формате .jar с блоком можно по этой ссылке. Увидеть графическое объяснение работы алгоритма Нидлмана — Вунша можно на анимации 1. Это не чистый алгоритм, предложенный изначально, а немного доработанная версия. Здесь вводится понятие штрафа за гэп(причем афинного - т.е штраф за открытие гэпа и штраф за продолжение отличается. Кроме того, здесь иначе штрафуются гэпэ в начале и в конце.)
Рис. 3. Глобальное выравнивание с помощью программы needle.
Анимация 1. Модифицированный алгоритм Нидлмана — Вунша. Используется таблица BLOSUM62. Штрафы: за открытие гэпа - 7, за продолжение гэпа - 1, за гэпы в начале и конце - 0.5 . Анимация изготовлена в образовательных целях, любое использование должно сопровождаться ссылкой на сайт http://kodomo.fbb.msu.ru/~darkvampirewolf.
С помощью программы water было получено локальное выравнивание этих двух последовательностей.(см рис. 4.)
Рис. 4. Локальное выравнивание с помощью программы water
Далее аналогичные действия были проведены с двумя заведомо негомологичными белками. (см рис. 5. и рис. 6. )
Рис. 5. Глобальное выравнивание с помощью программы needle двух заведомо негомологичных белков.
Рис. 6. Локальное выравнивание с помощью программы water двух заведомо негомологичных белков.
Затем была составлена таблица 1, содержащая результаты сравнительной характеристики полученных выравниваний.
Таблица 1. Сравнительная характеристика выравниваний, полученных выше.
Длина выравнивания | Число совпадений | Процент совпадений | Число сходных остатков | Процент сходных остатков | Число гэпов | Процент гэпов | Число открытий гэпов | |
Выравнивание вручную в Jalview | 138 | 28 | 0,2 | 19 | 0,14 | 32 | 0,23 | 4 |
Глобальное выравнивание с помощью needle | 140 | 31 | 0,22 | 18 | 0,13 | 24 | 0,17 | 4 |
Локальное выравнивание c помощью water | 120 | 31 | 0,26 | 18 | 0,15 | 24 | 0,2 | 4 |
Глобальное выравнивание 2х заведомо негомологичных белков | 296 | 52 | 0,18 | 28 | 0,09 | 87 | 0,29 | 14 |
Локальное выравнивание 2х заведомо негомологичных белков | 145 | 33 | 0,23 | 21 | 0,14 | 37 | 0,26 | 7 |
После этого к парному выравниванию , полученному из множественного, было добавлено выравнивание, полученное с помощью программы needle. Двигая обе новые последовательности одновременно - не нарушая их выравнивания - так, чтобы добиться совпадения с выравниванием тех же последовательностей в исходном множественном выравнивании,я получил результат, представленный на рис. 7.. "+" отмечены участки выравнивания, которые я считаю достоверными. С помощью программы SupCheck я проверил правильность выравнивания. "S" отмечены участки, подтвержденные совмещением пространственных структур(кроме этого если участок с "гэпами расположен между двумя совмещающимися участками он трактовался также как пространственное совмещение, т.к в данном случае практически очевидна вставка нескольких аминокислот), "C" - участки, которые очень похожи друг на друга по форме, но в файле расположенные на некотором удалении. Я обнаружил 5 ошибок второго рода в своем выравнивании( "атомы двух остатков, очевидно, хорошо совмещаются, но соответствующие буквы либо не находятся в одной колонке, либо в одной колонке, но колонка не отмечена "+"") - это результат того, что мною было неправильно интерпретирована корректность одного из начальных участков выравнивания. В выравнивании выравниваний "S" означает совпадение и в одном и в другом, "1" - в первом, "2" - во втором.
Рис. 7. Анализ выравнивания. Разметка взята из первого выравнивания, полученного с помощью множественного.
Оба выравнивания(и множественное, и полученное с помощью программы needle можно одинаково считать "правильными"(хотя все-таки более правильным оказывается выравнивание, полученное на основе множественного - в одном месте оно точнее совпадает с пространственным), т.к их одинаковые участки хорошо совмещаются и в структуре, а различные - одинаково плохо совмещены в структуре.)
Результаты в формате проекта JalView .jar можно скачать по этой ссылке