Карань Анна
студентка факультета биоинженерии и бионформатики

Анализ множественных выравниваний

Для данного анализа взято выравнивание, полученное в прошлом практикуме (номер 9).

Задание 1

В первой задании нужно было найти все вертикальные блоки данных последовательностей. Это понятие очень расплывчатое. Я использовала определение данное в словаре терминов на kodomo:
Вертикальный блок это участок множественного выравнивания, обладающий следующими свойствами:
a. Не содержит гэпов.
b. Длина - не менее 4 колонок.
c. Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.
d. Процент абсолютно консервативных колонок больше ... 35%
e. Не содержит более .... 10 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.
f. Не может быть расширен без нарушения предыдущих свойств.
Однако, и это определение не очень точное, поэтому в принципе возможно нескольок вариантов выбора верикальных блоков. На Рис.1 представлен выбранный мной вариант.

Рис.1 Выравнивание, раскрашенное по схеме BLOSUM62, где добавлена строка разметки "vertical block", на которой символами B отмечены вертикальные блоки.

Выравнивание в формате: FASTA, MSF
Во второй части первого задания нужно было найти блок из части последовательности, т.е. тот у которого будет предположительная гомологичность столбцов для части последовательность и негомологичность для всех последовательностей. На Рис.2 показан выбранные блок и группа последовательностей.

Рис.2 Выравнивание раскрашенное по схеме BLOSUM62, где выделена группа из 3-х последовательностей и символами H отмечен блок из этой части последовательностей

Данный блок является вертикальным блоком для 3-х выбранных последовательностей по вышеизложенному определению. Здесь 2 консервативные колонки из 5 (40%), первая - абсолютно консерватина, вторая - функционально абсолютно консервативна, остальные пункты также выполняются.
Если же брать все последовательности, то получается, что нет ни одной консервативной колонки, ни первая, ни вторая даже не функционально консервативны. Т.е. определение вертикального блока не выполняется.

Задание 2

Во втором задании необходимо посчитать число абсолютно консервативных позиций; абсолютно функционально консервативных для одного из блоков. Абсолютно функционально консервативные позиции определяются на основе групп аминокислот, предоставленных в задании:
KR, ST, LIVM, FYW, DN, EQ, P, G, A, H, С
Для анализа возьмем 2-ой блок, самый крупный.

Таблица 1. Число и процент абсолютно консервативных позиций; абсолютно функционально консервативных для второго блока
Абсолютно консервативных позиций1346,43%
Абсолютно функционально консервативных позиций414,29%

Во второй части 2 задания нужно на самом длинном участке, не входящем в блок, посчитать число и процент позиций с гэпами.
В моем случае это участок после последнего блока и до конца, на выравнивании он отмечен символами X.

Таблица 2. Число и процент позиций с гэпами на самом длинном участке, не входящем в блоки
Число2
Процент7,69%

Задание 4

В этом задании нужно построить консунсусную последовательность и LOGO выбранного блока. С помощью команды consambig на сервере kodomo была получена следующая консенсусная последовательность:

GITXXAXXXLGDXVFXXLPEXXXXXXXG

Полную аннотацию консенсусной последовательности можно скачать здесь .
Дальше на сервере Weblogo было получено изображение LOGO для данного блока. (Рис. 3)

Рис.3 Изображение LOGO для второго блока

Задание 5

На основе LOGO необходимо построить паттерн выбранного блока.

G-I-T-[EDN]-[HYF]-A-[AQY]-x(2)-L-G-D-[VM]-V-F-[VIL]-[EDQ]-L-P-E-[VI]- [GD]-x-[ETA]-[VI]-x(2)-G

Задание 6

В этом задании необходимо добавить заведомо негомологичную данным последовательность, построить выравнивание и найти процент совпадений с консервативными колонками в блоках.

Таблица 3. Число и процент абсолютно консервативных позиций; абсолютно функционально консервативных для второго блока
БлокЧисло абсолютно консерватиных позиций/Число абсолютно функционально консервативных позицийЧисло совпадающих у негомологичной последовательности абсолютно консервативных позиций/абсолютно функционально консервативных позиций
12/00/0
213/43/2
33/00/0
42/10/0
53/00/0
Всего285

Рис.4 Выравнивание с добавлением заведомо негомологичной последовательности и раскрашенное по схеме BLOSUM62

Данное выравнивание выбрано, потому что в большинстве других, если и было больше совпадений, то не в блоках, а в отдельных консервативных колонках, поэтому я выбрала вариант, где было наибольшее количество совпадений хотя бы одном самом крупном блоке. Процент совпадающих консерватиных позиций (и функционально тоже) равен 17,86% от изначальных (5 из 28).
Выравнивание в формате: FASTA, MSF
Проэкт Jalview до анализа полностью негомологичных последовательностейскачать здесь

Задание 7

В этом задании нужно построить выравнивание всех заведомо негомологичных последовательностей и попытаться найти блоки, включающие не меньше половины последовательностей.

Рис.5 Выравнивание заведомо негомологичных последовательностей и раскрашенное по схеме BLOSUM62

Так как последовательности абсолютно негомологичны, то вертикальных блоков нет вообще, я смогла выделить только блоки для 3-х последовательностей (разных для двух блоков). Они очень маленькие и для 3-х последовательностей, поэтому естественно гомологию не отражают.

Таблица 4. Число и процент абсолютно консервативных позиций; абсолютно функционально консервативных для второго блока
БлокЧисло и процент абсолютно консерватиных позицийЧисло и процент абсолютно функционально консервативных позиций
12 33,3%1 16,7%
22 50%1 25%

Выравнивание в формате: FASTA, MSF
Видна огромная разница между выравниваниями, полученными для гомологичных и негомологичных последовательностей. В последнем случае даже не получилось выбрать ни одного вертикального блока. Это говорит о достаточной достоверности метода выравнивания последовательностей и выделения блоков для определение гомологии.


©Карань Анна, 2015