УЧЕБНЫЙ САЙТ
Буяновой Мишель
ФАКУЛЬТЕТ БИОИНЖЕНЕРИИ
И БИОИНФОРМАТИКИ МГУ им. М.В. ЛОМОНОСОВА
Семестр IV Семестр III Семестр II Cеместр I

Множественные выравнивания

Задание 1. Поиск блоков в выравнивании

Для выполнения заданий этого практикума использовалось множественное выравнивание, полученное в результате выполнения прошлой работы.

Строгое техническое определение вертикального блока, на которое я ориентировалась:

Вертикальный блок — это участок множественного выравнивания, обладающий следующими свойствами:
 
 a. Не содержит гэпов.
 b. Длина - не менее 4 колонок.
 c. Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны.
 d. Процент абсолютно консервативных колонок больше ... 35%
 e. Не содержит более .... 10  колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд.
 e. Не может быть расширен без нарушения предыдущих свойств.

1a. Блоки помечены в дополнительном ряду символом 'B'.

Файл проекта 1а: [JVP]

1b. Три последовательности (с идентификаторами I4D9Z1_DESAJ, GCSH_LEPBP, I1NDC6_SOYBN) показались мне более схожими, и я объединила их в группу. Внутри этой группы нашёлся блок (20-26 позиции, отмечен символом 'H'). Интересно отметить то, что, следуя определению блока выравнивания в биологическом плане, можно утверждать гомологичность аминокислот внутри этого блока. Но блок мы нашли именно в выделенной группе, а не в целом (рассмотрев указанный отрезок выравнивания на всех пяти последовательностях, поймем, что блоком это не является). Поэтому данных о гомологии аминокислот двух оставшихся последовательностей с аминокислотами из последовательностей группы нет.

Файл проекта 1b: [JVP]

Задание 2. Подсчёт консервативных позиций и гэпов

2a. Функционально абсолютно консервативными позициями считались позиции со следующими группами аминокислот:

KR
ST
LIVM
FYW
DN
EQ
P
G
A
H
С

Таблица 1. Консервативные позиции в блоке 81-88

Тип консервативности позицийАбсолютно
консервативные
Абсолютно функционально
консервативные
Количество34
Процент37.5%50%


2b. Символом 'X' отмечен самый длинный участок выравнивания 89-124, не входящий в состав блоков.

Для подсчётов использовался участок 89-124.

Длина участка: 36
Гэповых позиций: 6
Процент гэповых позиций: 16.67%

Файл проекта 2b: [JVP]

Задание 4. Консенсусная последовательность и LOGO блока 30-38

Консенсусная последовательность была извлечена из Jalview:

>Consensus/30-38 Percentage Identity Consensus 
GDIVFVELP

Изображение LOGO было получено при помощи сервиса Weblogo Threeplusone:

Задание 5. Паттерн блока 30-38

Используя указанный в задании синтаксис, я построила паттерн исследуемого блока:

G-[DE]-[IV]-[VA]-[FY]-[VI]-[ED]-L-P

Задание 6. Добавление негомологичной последовательности в выравнивание

К имеющимся пяти последовательностям я добавила участок последовательности своего белка NP_069398.1 длиной 124 (c 14 по 137 позицию). В результате я получила выравнивание крайне низкого качества, добавление гэпов не очень помогло делу. Итак, получилось 3 абсолютно консервативные колонки в блоках (23% от 13 имевшихся до добавления) и 4 абсолютно (как в задании 2) функциональные колонки (19% от 21 ранее имевшихся).

Файл проекта 6: [JVP]

Задание 7. "Выравнивание" негомологичных белков

Для выполнения задания я импортировала (Fetch Sequences) последовательности белков из таблицы курса. Их AC: O50105; C7C422; V6F4Q0; P21853; Q9RT63.

Что вполне ожидаемо, после некоторых попыток обрезать последовательности по-разному "хорошего" выравнивания так и не получилось. Что самое важное: нет ни единого участка, который можно было бы назвать вертикальным блоком. Однако же, выделив три из последовательностей в отдельную группу, можно заметить некоторые участки, которые выровнялись относительно неплохо. (Если пренебречь тем, что блок обязан начинаться и кончаться абсолютно консервативной колонкой, процентным содержанием абсолютно консервативных колонок в блоке и т.д.).

Можно поподробнее рассмотреть один из немногих "блоков". Длина — 5, абсолютно консервативная колонка единственная(20%), две функционально консервативных(40%).

Также, выделив один длинный участок 169-420 без блоков (впринципе, там почти всё занято такими участками), проанализируем количество гэповых позиций.

Итак,
Длина участка: 252
Число гэповых позиций: 231
Процент гэповых позиций: 91.67%

Полученные числа подтверждают бессмысленность выравниваний в случае негомологичных последовательностей. А найденные "блоки" так и остатся в кавычках, ибо потребовалось не только сузить круг рассматриваемых последовательностей до трёх, но и пренебречь некоторыми достаточно важными, хоть и техническими, критериями в определении блока. Так что этот контрпример подтверждает следующее: очень мала вероятность того, что мы случайным образом берём из банка несколько последовательностей и получаем стройное выравнивание с вертикальными блоками, малым количеством гэпов и большим процентом консервативных позиций. Скорее всего получится нечто похожее на то, что мы увидели в этом задании.

Файл проекта 7: [JVP]