Предсказание парных выравниваний. Jalview.

Получение парного выравнивания

Исходным выравниванием для работы стало выравнивание на сайте kodomo. Оно было скачено в формате Fasta на мой рабочий компьютер и обработано при помощи редактора Jalview.

Для дальнейшей обработки из него были удалены все последовательности кроме последних двух. Полученное выравнивание представлено по ссылке. Фрагмент полученного выравнивания можно видеть на рис.1.


Рис.1. Фрагмент выравнивания, содержащий две исследуемые последовательности

Локальное и глобальное выравнивание

Существует два типа выравниваний - локальные и глобальные. Алгоритм для построения глобальных выравниваний считает последовательности гомологичными и предполагает наличие сходства на протяжении всего выравнивания. Алгоритм для построения локального выравнивания, напротив, ищет сходные участки и выравнивает последовательности относительно них.

Для постоения глобальных выравниваний была использована программа needle пакета EMBOSS. Полученное выравнивание можно скачать здесь в формате fasta или в формате needle. На рис.2. приведен участок полученного глобального выравнивания для исследуемых последовательностей.


Рис.2. Фрагмент глобального выравнивания

Для постоения локальных выравниваний была использована программа water пакета EMBOSS. Полученное выравнивание можно скачать здесь в формате fasta или в формате water. На рис.3. приведен участок полученного локального выравнивания для исследуемых последовательностей.


Рис.3. Фрагмент локального выравнивания

Также было построено глобальное и локальное выравнивание заведомо негомологичных последовательностей. Для этого были выбраны две случайные последовательности белков из списка.

Проект в формате jar, содержащий выше названные выравнивания, можно скачать по ссылке. Выравнивания негомологичных белков смотреть по данным ссылкам: Глобальное, формат fasta; Глобальное, формат needle; Локальное, формат fasta; Локальное, формат water;

В таблице 1 приведены характеристики полученных выравниваний.

Выравнивание Длина выравнивания Число совпадений Процент совпадений, % Число сходных остатков Процент сходных остатков, % Число гэпов Процент гэпов, % Число открытий гэпов
Начальное парное выравнивание 149 36 24.16 54 36.24 20 13.42 9
Глобальное выравнивание 166 39 23.49 50 30.12 48 28.92 8
Локальное выравнивание 96 33 34.38 41 42.7 11 11.46 4
Глобальное выравнивание негомологичных последовательностей 388 11 2.89 24 6.18 339 87.37 5
Локальное выравнивание негомологичных последовательностей 82 20 24.39 33 40.24 20 24.39 5

Первые три выравнивания по характеристикам схожи. Это логично, ведь мы выравниваем одни и те же последовательности. Кроме того, из небольшого процента гэпов можно сделать вывод о наличии гомологии между данными последовательностями.

Также из таблицы хорошо видны различия между локальными и глобальными выравниваниями. В локальных выравниваниях процент гэпов минимизируется, но они короче, не захватывают всех последовательностей. Глобальное выравнивание негомолдогичных белков дает огромное число гэпов и малое число совпадений.

Описание отличного участка при компановке двух выравниваний

Для выполнения данного задания два типа выравниваний были совмещены в одном окне. Глобальное выравнивание было добавлено к изначальному. Полученное выравнивание можно скачать здесь.

На рис.4. приведен фрагмент данного выравнивания, где глобальное выравнивание совпало с изначальным.


Рис.4. Фрагмент общего выравнивания, демонстрирующий полное совпадение глобального и изначального выравниваний. Участок совпадения выделен красной рамочкой.

На рис.5. приведен участок несовпадений выравниваний. Этот участок расположен с 42 по 52 аминокислотный остаток выравнивания. Длина его равна 10 остаткам, и все 10 не совпадают. Как видно из рис.5, данный фрагмент непохож у двух исследуемых белков, но при этом содержит несколько аминокислот со схожими свойствами. Поэтому выравнять эти аминокислоты можно по-разному, что мы и видим в двух разных типах выравнивания.


Рис.5. Фрагмент общего выравнивания, демонстрирующий несовпадение глобального выравнивания с исходным. Участок несовпадения выделен красной рамочкой.

Проверка правильности выравниваний

Проверка на правильность выравнивания осуществляется с помощью программы SupCheck, которая совмещает пространственные структуры двух белков и подкрашивает их в соостветствии с выравниванием. Такая проверка может помочь найти ошибки в выравнивании и установить гомологию между участками белка.

Проект, содержащий проверенные выравнивания, можно скачать здесь. В исходном выравнивании проверка обнаружила 3 ошибки I рода и 6 ошибок II рода. В глобальном выравнивании нашлось 12 ошибок I рода и 7 ошибок II рода. Значит, глобальное выравнивание учитывает пространственную структуру белков, но дает выравнивания участков, не имеющих гомологии. В исходном выранивании таких участков меньше.

© Маслова Валентина, 2014
Последнее изменение: 17.05.2014