Учебный сайт Екатерины Швецовой

Предсказание парных выравниваний

Скачать проект практикума

Для выполнения задания было дано множественное выравнивание, из которого, удалив все последовательности кроме двух последних и удалив пустые столбцы, я получила следующее парное выравнивание. Фрагмент множественного выравнивания показан на рис. 1, фрагмент полученного парного выравнивания - на рис. 2.

Фрагмент множественного выравнивания

Рис. 1. Фрагмент исходного множественного выравнивания в раскраске ClustalX, консервативность 70%.

Фрагмент парного выравнивания

Рис. 2. Фрагмент парного выравнивания, полученного из исходного множественного выравнивания. Раскраска ClustalX, консервативность 70%. Позиции с 45 по 138.

Далее я использовала программу needle на kodomo, чтобы получить глобальное выравнивание последних двух последовательностей. Для сохранения файла в формате .fasta я использовала опцию -aformat3 fasta. Были получены следующие 2 файла: файл в формате .needle и файл в формате .fasta. Фрагмент полученного выравнивания представлен на рис. 3. Видно, что глобальное выравнивание не полностью совпадает с парным выравниванием, полученным из исходного множественного.

Фрагмент глобального выравнивания

Рис. 3. Фрагмент глобального выравнивания последних двух последовательностей. Раскраска ClustalX, консервативность 70%. Позиции с 48 по 140.

Чтобы получить наилучшее локальное выравнивание двух последовательностей, я воспользовалась программой water на kodomo. Так же, как и в предыдущем задании, я использовала опцию -aformat3 fasta для сохранения файла в формате .fasta. Полученные файлы: файл в формате .water и файл в формате .fasta. Фрагмент полученного выравнивания представлен на рис. 4.

Фрагмент локального выравнивания

Рис. 4. Фрагмент наилучшего локального выравнивания двух последовательностей. Раскраска ClustalX, консервативность 70%. Позиции с 28 по 120.

Те же самые задания надо было сделать для выравнивания заведомо негомологичных последовательностей. Для выравнивания я взяла два белка: мой и Александры. Я выполнила абсолютно аналогичные действия для получения файлов для глобального выравнивания (.needle и .fasta) и для локального выравнивания (.water и .fasta). Фрагмент глобального выравнивания последовательностей негомологичных белков представлен на рис. 5, наилучшее локальное выравнивание - на рис. 6.

Фрагмент глобального выравнивания негомологичных последовательностей

Рис. 5. Фрагмент глобального выравнивания двух негомологичных последовательностей. Раскраска ClustalX, консервативность 70%. Позиции с 155 по 245.

Локальное выравнивание негомологичных последовательностей

Рис. 6. Наилучшее локальное выравнивание негомологичных последовательностей. Раскраска ClustalX, консервативность 70%.

Далее нужно было сравнить пять полученных выравниваний. В таблице 1 приведены их характеристики. Для составления таблицы я использовала информацию из аннотаций файлов .needle и .water, а так же часть данных было подсчитано вручную.

Таблица 1. Характеристики полученных выравниваний

Выравнивание Длина выравнивания Число совпадений Процент совпадений Число сходных остатков Процент сходных остатков Число гэпов Процент гэпов Число открытий гэпов
Парное выравнивание, полученное из множественного выравнивания 138 30 21.7% 58 42% 38 27.5% 6
Глобальное выравнивание двух последних последовательностей 140 31 22.1% 49 35% 42 30.0% 6
Локальное выравнивание двух последних последовательностей 120 31 25.8% 49 40.8% 24 20% 4
Глобальное выравнивание негомологичных последовательностей 444 10 2.3% 21 4.7% 402 90.5% 5
Локальное выравнивание негомологичных последовательностей 29 9 31% 14 48.3% 5 17.2% 1

Проанализировав данные, содержащиеся в таблице, можно заметить, что парное выравнивание, полученное из множественного, отличается по характеристикам от глобального выравнивания этих же последовательностей, но очень незначительно. Глобальное выравнивание предположительно гомологичных последовательностей так же не сильно отличается от их наилучшего локального выравнивания, но все же локальное выравнивание немного лучше (меньше процент гэпов, меньше число открытий гэпов, процент совпадающих остатков больше). Данное наблюдение подтверждает предположение о гомологичности этих последовательностей, т. к. их полное выравнивание почти такое же хорошее, как и выравнивание их наиболее сходных частей (к тому же длина локального выравнивания совсем немного меньше длины глобального, т. е. сравнительно большие участки последовательности хорошо выравниваются). Для выравниваний заведомо негомологичных последовательностей мы видим абсолютно противоположную картину. Локальное выравнивание намного удачнее (процент совпадающих и сходных остатков значительно больше, процент гэпов - меньше). Длина локального выравнивания более чем в пятнадцать раз меньше длины глобального, значит сходны только очень короткие участки последовательностей, что скорее всего является случайностью. Следовательно, предположение о негомологичности белков подтвердилось.

Для наглядного сравнения парного выравнивания, полученного из множественного, с глобальным выравниванием, полученным с помощью программы needle, я соединила два выравнивания в одном окне Jalview и двигала две последние последовательности (второе выравнивание), относительно первых двух (первое выравнивание). Проект получившегося сравнения двух выравниваний можно скачать здесь. Выравнивания почти совсем не совпадают с 1 по 61 позицию (совпадения наблюдаются только на небольших участках: 1-4, 11-16, 39-41), далее идёт достаточно большой идентичный участок (позиции с 62 по 100), небольшой участок различия (101-110) и затем до 139 позиции выравнивания совпадают. Второй участок различия, заключенный между двумя фрагментами участков совпадения выравниваний показан на рис. 7. В этом участке всего 10 несовпадающих колонок, причём видно, что последовательность 1SA8_A выравнена одинаково, различия наблюдаются только в выравнивании последовательности 3STK_A (разные варианты расстановки гэпов).

Сравнение выравниваний

Рис. 7. Участок различия двух выравниваний, заключенный между двумя фрагментами из 5-ти совпадающих колонок. Раскраска ClustalX, консервативность 80%. На рисунке показаны позиции с 96 по 115. Снизу расположено глобальное выравнивание, полученное с помощью needle.

Следующим этапом работы была проверка правильности парного выравнивания и выравнивания, полученного с помощью программы needle. Я создала по две дополнительные строки аннотации для каждого проверяемного выравнивания в окнах Jalview. В ниждей строке я отметила "+" те позиции, которые по моему мнению являются достоверными (я руководствовалась тем, что эти позиции входят в относительно схожие участки последовательностей, гомологичные блоки).
Чтобы проверить правильность выравниваний на основе пространственных структур белков, я скачала файлы из папки, соответствующей выбранному мной выравниванию, с помощью программы sup_check.exe, предварительно переименовав файл с проверяемым выравниванием в aln_11.fasta, создала скрипт aln_11.scr, который затем открыла в Rasmol. С помощью программы Rasmol я проверила, какие C_alpha атомы последовательностей совмещаются по пространственным структурам. Совмещающиеся колонки я отметила буквой "s" в верхней строке аннотации.

Далее было обнаружено 2 вида ошибок: C_alpha атомы пары остатков в колонке выравнивания, помеченной "+", не совмещаются (ошибки 1 рода, помечены цифрой "1"), C_alpha атомы совмещаются, но соответствующая колонка "+" не помечена (ошибки 2 рода, помечены цифрой "2"). Фрагмент парного выравнивания с указанием ошибок показан на рис. 8, получившийся файл .jar можно скачать здесь. Фрагмент глобального выравнивания, полученного с помощью needle - на рис. 9, получившийся файл .jar можно скачать здесь.

Ошибки парного выравнивания

Рис. 8 Парное выравнивание, полученное их множественного выравнивания, с указанием ошибок. Раскраска ClustalX, консервативность 70%.

Ошибки глобального выравнивания

Рис. 9 Глобальное выравнивание, полученное с помощью программы needle, с указанием ошибок. Раскраска ClustalX, консервативность 70%.

В парном выравнивании обнаружилось 7 ошибок 1-го рода и 37 ошибок второго рода (общий процент ошибок - 31,9%). В глобальном выравнивании ошибок немного больше: 22 - 1-го рода и 29 2-го рода (процент ошибок - 36,4%). Т. е. в целом выравнивания неплохие, хотя парное немного удачнее.

Совместив наиболее удачные участки двух выравниваний я попыталась составить своё, наиболее правильное выравнивание. За основу я взяла глобальное выравнивание из needle, однако начало моего выравнивания взято из парного, т. к. для глобального выравнивания значительное количество позиций в начале оказались ошибочными. Своё выравнивание я проверила на правильность, выполнив те же действия, что и для предыдущих двух выравниваний. Фрагмент составленного мной выравнивания показан на рис. 10, получившийся файл .jar можно скачать здесь. Выравнивание в формате .fasta находится здесь.

Правильное выравнивание

Рис. 10 Правильное выравнивание с указанием ошибок. Раскраска ClustalX, консервативность 70%.

В моём выравнивании обнаружилось 6 ошибок 1-го рода и 34 ошибки 2-го рода. Общий процент ошибок - 28,6%. Т. е. возможно, что данное выравнивание более достоверно, чем два предыдущих.

©Shvetsova Ekaterina, FBB MSU, 2013
Дата последнего изменения: 07.12.2016