ФББ 2013-2014

Предсказание парных выравниваний.

Проект Jalview с выравниваниями и разметкой можно скачать здесь.

Парное выравнивание - это выравнивание двух аминокислотных последовательностей друг относительно друга. Оно строится с той же целью, что и множественное выравнивание - то есть по парному выравниванию пытаются оценить гомологию данных последовательностей. Однако работа с парным выравниванием всегда предполагает ориентацию на множественное выравнивание белков этого семейства, это нужно для более точной оценки консервативности.

Для выполнения заданий я выбрала это выравнивание и совмещение из предложенных. Само выравнивание можно увидеть здесь. Затем я открыла это выравнивание в редакторе JalView, общий вид проекта можно увидеть на рисунке 1.

Рис.1. Множественное выравнивание 16-ти последовательностей.

Для того, чтобы более наглядно увидеть родственные связи между белками, я построила дерево множественного выравнивания (рисунок 2). По нему видно, что последовательности, которые я буду выравнивать, не очень гомологичны друг другу (по крайней мере по сравнению с остальными). 1IXX - это белок из яда змеи хабу, который связывается с факторами свёртывания крови IX/X. 2ZIB - это Ca-независимый белок-антифриз, выделенный из Brachyopsis rostratus (это костистая рыба).

Рис.2. Дерево множественного выравнивания. Выбранные для парного выравнивания последовательности обведены в красный прямоугольник.

По заданию 1 необходимо построить вручную выравнивание двух последних последовательностей из множественного выравнивания относительно друг друга. Результат:

Рис.3.Парное выравнивание последовательностей 1IXX_A и 2ZIB_A, построенное с помощью средств Jalview.

Для выполнения задания 2 я воспользовалась командой needle на kodomo. Программа needle использует алгоритм Нидлмана-Вунша для построения глобального выравнивания двух последовательностей. Глобальное выравнивание подразумевает гомологию последовательностей по всей длине, туда включаются обе последовательности целиком. Сначала я получила парное выравнивание двух последних последовательностей в формате по умолчанию, его можно скачать здесь. Затем, дописав опцию -aformat3 fasta я получила output файл в формате fasta, с ним можно ознакомиться здесь. Выравнивание в формате fasta я визуализировала в JalView, раскраска BLOSUM62 (рисунок 4).

Рис.4.Парное выравнивание двух последних последовательностей (1IXX_A и 2ZIB_A) из множественного выравнивания, построенное с помощью программы needle на kodomo. Раскраска BLOSUM62

Далее я построила наилучшее локальное выравнивание двух последних последовательностей (1IXX_A и 2ZIB_B) в формате fasta, используя для этого команду water на kodomo. Локальное выравнивание строится, когда в последовательностях есть негомологичные участки, тогда они исключаются и выравнивание идёт между гомологичными участками. Для получения локального выравнивания используют алгоритм Смита-Ватермана. Результат в формате fastа можно увидеть здесь. В редакторе Jalview это выравнивание выглядит так:

Рис.5.Наилучшее локальное выравнивание двух последовательностей (1IXX_A и 2ZIB_B), открытое в редакторе Jalview. Раскраска BLOSUM62.

Для выполнения задания 4 я взяла 2 последовательности: 1IXX_A (с ней же велась работа в заданиях 2 и 3) и 3GL3_A (с этой последовательностью я работала в более ранних практикумах). Последовательности заведомо негомологичны: 1IXX_A - это змеиный яд, а 3GL3_A - это прокариотный белок дисульфидного обмена. Полученные результаты глобального и локального выравниваний:

Рис.6. Выравнивание заведомо негомологичных последовательностей белков с pdb идентификаторами 3GL3 и 1IXX. На верхнем рисунке - глобальное выравнивание, на нижнем - локальное.

Сравнение параметров выравниваний приведено в таблице 1. Как видно, выравнивание вручную даёт менее точные результаты, чем глобальное и локальное выравнивание с помощью алгоритмов. Сравнивать же локальное и глобальное выравнивание нельзя, но стоит отметить, что в случае гомологичных последовательностей длина глобального и локального выравниваний отличаются не намного, в то время как для заведомо негомологичных последовательностей длина локального выравнивания совсем маленькая. В выравниваниях заведомо негомологичных последовательностей наблюдается заметно больше гэпов, с помощью них программа пыталась найти хоть какое-нибудь сходство. Число и процент совпадений в глобальных выравниваниях гомологичных и негомологичных последовательностей различаются не сильно за счёт того, что программа вставила много гэпов в выравнивание негомологичных последовательностей. В локальном выравнивании негомологичных последовательностей мы видим самое большой процент совпавших остатков, однако из этого нельзя сделать вывод о гомологии, т.к. это сходство достигается за счёт большого процента гэпов и оно наблюдается на коротком участке по сравнению с глобальным выравниванием.

Табл.1 Параметры проведённых парных выравниваний.

Длина выравнивания (число колонок)

Число

совпадений

Процент совпадений

Число сходных остатков

Процент сходных остатков

Число гэпов

Процент гэпов

Число открытий гэпов

Выравнивание вручную в Jalview (рис. 3б)

144

31

21,5%

45

32,25%

26

18%

5

Глобальное выравнивание с помощью needle (рис.4)

148

35

23,6%

56

37,8%

34

23%

6

Локальное выравнивание c помощью water (рис.5)

134

35

26,1%

56

41,8%

23

17,2%

5

Глобальное выравнивание 2х заведомо негомологичных белков (рис.6)

190

29

15,3%

48

25,3%

99

52,1%

7

Локальное выравнивание 2х заведомо негомологичных белков (рис.6)

63

18

28,6%

29

46%

23

36,5%

3

Выполняя задание 6, я добавила глобальное выравнивание, полученное с помощью needle, к выравниванию, которое я получила вручную. Сразу обнаружилось высокое сходство на начальном участке выравниваний, там не пришлось ничего двигать (рисунок 7).

Рис.7. Высокое сходство двух парных выравниваний одних и тех же последовательностей на начальном участке.

Однако на концевом участке выравнивания совмещались не так хорошо. Чтобы получить совмещение я вставила 3 гэпа в обе последовательности первого выравнивания так, чтобы это не повлияло на само выравнивание. Получилось хорошее совмещение (до - рисунок 8, после - рисунок 9).

Рис.8. Концевой участок выравниваний, на котором автоматическое выравнивание сильно отличается от полученного вручную.

Рис.9. Совмещение двух выравниваний на концевых участках путём добавления гэпов в первое выравнивание.

Проверять правильность выравнивания я буду с помощью программы SupCheck, которая совмещает пространственные структуры двух белков. Это может помочь найти ошибки в выравнивании (обычно они есть) и установить гомологию между участками белка. Окно Rasmol с совмешением двух структур показано на рисунке 10. Выравнивание, полученное с помощью needle, в целом более соответствует пространственному совмещению, чем выравнивание с помощью удаления гэпов.

Рис.10. Совмещение двух пространственных структур белков 1IXX_A и 2ZIB_A в Rasmol.

Для каждого выравнивания я отдельно посмотрела его соответствие с совмещением. Количество ошибок в выравнивании вручную: 40 ошибок I рода (остатки, расположенные в одной колонке выравнивания, на структуре не совмещены), 4 ошибки II рода (хорошо совмещающиеся в пространстве остатки не расположены в одной колонке выравнивания). Количество ошибок при выравнивании needle: 26 ошибок I рода, 3 ошибки II рода. На рисунке 11 показан участок выравнивания с ошибками I рода. На самом деле, обе цепи образуют сходные в пространстве структуры на участке, выделенным красным в Jalview, но эти структуры расположены под разным углом, поэтому формально не совмещаются. Однако и на этом участке можно говорить о гомологии из-за двух причин: совпадают довольно редкие аминокислоты и при наложении независимо от других частей белков эти участки совпали бы.

Рис.11. Совмещение двух пространственных структур белков 1IXX_A и 2ZIB_A в Rasmol.