Учебный сайт Ксении Березиной

Множественные выравнивания

Выравнивание сделано с помощью программы Jalview, покраска — ClustalX, консервативность ("Above identity threshold") 70%.

Исходная последовательность (в формате fasta)

Проект заданий 1-5 (в формате jar)

Задание 1

Для начала найдем в выравнивании, построенном программой Jalview, два вертикальных блока аминокислотных остатков, в которых они наиболее сходны во всех белках.

Рис.1. Вертикальный блок выравнивания (позиции № 1-27).
Рис.2. Вертикальный блок выравнивания (позиции № 442-467).

В этих блоках (рис. 1, 2) можно ожидать гомологию остатков разных последовательностей. Код последовательностей белков в базе UniProt указан в колонке слева. В блоке 2 можно заметить, что однобуквенные обозначения аминокислот в столбцах 13-16 не совпадают. Я считаю, что все же можно подозревать здесь консервативность, так как остатки часто сходны по своим свойствам и строению. Например, треонин и серин (есть гидроксильные группы); валин и лейцин (гидрофобные, только углеродный скелет в радикале).

В качестве следующего задания нужно было найти блок, где две последовательностей предположительно гомологичны, а другие сильно отличаются от них. На рисунке 3 можно увидеть, что белки ANOGA и DROME имеют сходства аминокислотных остатков между собой, в то время как остальные -- нет. Сортировка была сделана с помощью опции "Sort by pairwise identity". Можно предположить, что эти белки эволюционно ближе друг другу, чем остальным представленным.

Рис.3. Участки выравнивания, на которых два белка (выделены) имеют высокую степень сходства между собой.

Задание 2

Рассмотрим блок 2 подробно (таблица 1). Можно ли считать его достоверным?

Рис.2. Вертикальный блок выравнивания (позиции № 442-467).

Таблица 1. Консервативность позиций блока 442-467 множественного выравнивания

Количество№ позицийПроцент позиций
Всего позиций26100%
Абсолютно консервативных позиций66, 7, 13, 17, 24, 2523%
Абсолютно функционально консервативных позиций61, 8, 15, 18, 21, 2323%
Консервативных на 70% позиций73, 4, 5, 9, 11, 12, 2627%
Функционально консервативных на 70% позиций32, 14, 2212%

Таким образом, 85% позиций в этом блоке можно назвать гомологичными.

Задание 3

На рисунке 4 изображен участок выравнивания с тремя близко расположенными вертикальными блоками.

Всего позиций: 83

Позиций с гэпами: 4

Процент позиций с гэпами: 5%

Рис. 4. Участок выравнивания между вертикальными блоками (позиции №337-416).

Задание 4, 5

К блоку из задания 1 добавлена выданная последовательность и выровнена вручную. Для этого можно использовать перемещение последовательности с помощью стрелок и добавление гэпов с помощью клавишей Shift и Ctrl.

В итоге был выбран вариант, показанный на рисунке 5 (от новой последовательности оставлена только нужная часть).

Рис. 5. Выравнивание блока и новой последовательности (последняя).

Консенсусная последовательность получившегося выравнивания, то есть последовательность превалирующих аминокислотных остатков в каждой позиции (столбце):

GTFQQMWISKQEYEEGGKSCVERKCP

LOGO — изображение этой последовательности, созданное с помощью сервиса http://weblogo.berkeley.edu/logo.cgi — показано на рисунке 6.

Рис. 6. Logo консенсусной последовательности.

Задание 6

Проект (в формате jar)

Было построено выравнивание шести заведомо негомологичных белков. Их идентификаторы базы NCBI Protein переведены в Uniprot ID с помощью сервиса ID Mapping на сайте Uniprot. После импортирования последовательности выровнены функцией Web services -> Alignment -> Muscle with default.

Выделены два "блока" в выравнивании (рис. 7, 8). Раскраска ClustalX со значением Above identity threshold >0% показывает много разных цветов, но на самом деле гомологии нет. Для достоверности поднимем процент консервативности, при котором аминокислотные остатки раскрашиваются, до 50%. В итоге цветными остаются несколько разбросанных остатков, что отнюдь не говорит о родстве последовательностей. Кроме того, в таком ложном выравнивании значительно больше гэпов.

Рис.7. Участок выравнивания негомологичных белков (справа раскраска от 0% сходности, слева — от 50%).
Рис.8. Участок выравнивания негомологичных белков (справа раскраска от 0% сходности, слева — от 50%).

Таким образом, об истинной гомологичности последовательностей выравнивания свидетельствуют крупные блоки с хорошей консервативностью столбцов и небольшое количество гэпов.

Назад к второму семестру