Множественные выравнивания
Задание 1. Поиск блоков в выравнивании
Для выполнения заданий этого практикума использовалось множественное выравнивание, полученное в результате выполнения прошлой работы.
Строгое техническое определение вертикального блока, на которое я ориентировалась:
Вертикальный блок — это участок множественного выравнивания, обладающий следующими свойствами: a. Не содержит гэпов. b. Длина - не менее 4 колонок. c. Первая и последняя колонки - абсолютно консервативны или абсолютно функционально консервативны. d. Процент абсолютно консервативных колонок больше ... 35% e. Не содержит более .... 10 колонок, не являющихся абсолютно консервативными или абсолютно функционально консервативными, подряд. e. Не может быть расширен без нарушения предыдущих свойств.
1a. Блоки помечены в дополнительном ряду символом 'B'.
Файл проекта 1а: [JVP]
1b. Три последовательности (с идентификаторами I4D9Z1_DESAJ, GCSH_LEPBP, I1NDC6_SOYBN) показались мне более схожими, и я объединила их в группу. Внутри этой группы нашёлся блок (20-26 позиции, отмечен символом 'H'). Интересно отметить то, что, следуя определению блока выравнивания в биологическом плане, можно утверждать гомологичность аминокислот внутри этого блока. Но блок мы нашли именно в выделенной группе, а не в целом (рассмотрев указанный отрезок выравнивания на всех пяти последовательностях, поймем, что блоком это не является). Поэтому данных о гомологии аминокислот двух оставшихся последовательностей с аминокислотами из последовательностей группы нет.
Файл проекта 1b: [JVP]
Задание 2. Подсчёт консервативных позиций и гэпов
2a. Функционально абсолютно консервативными позициями считались позиции со следующими группами аминокислот:
KR ST LIVM FYW DN EQ P G A H С
Таблица 1. Консервативные позиции в блоке 81-88
Тип консервативности позиций | Абсолютно консервативные | Абсолютно функционально консервативные |
Количество | 3 | 4 |
Процент | 37.5% | 50% |
2b. Символом 'X' отмечен самый длинный участок выравнивания 89-124, не входящий в состав блоков.
Для подсчётов использовался участок 89-124.
Длина участка: 36Гэповых позиций: 6
Процент гэповых позиций: 16.67%
Файл проекта 2b: [JVP]
Задание 4. Консенсусная последовательность и LOGO блока 30-38
Консенсусная последовательность была извлечена из Jalview:
>Consensus/30-38 Percentage Identity Consensus GDIVFVELP
Изображение LOGO было получено при помощи сервиса Weblogo Threeplusone:
Задание 5. Паттерн блока 30-38
Используя указанный в задании синтаксис, я построила паттерн исследуемого блока:
G-[DE]-[IV]-[VA]-[FY]-[VI]-[ED]-L-P
Задание 6. Добавление негомологичной последовательности в выравнивание
К имеющимся пяти последовательностям я добавила участок последовательности своего белка NP_069398.1 длиной 124 (c 14 по 137 позицию). В результате я получила выравнивание крайне низкого качества, добавление гэпов не очень помогло делу. Итак, получилось 3 абсолютно консервативные колонки в блоках (23% от 13 имевшихся до добавления) и 4 абсолютно (как в задании 2) функциональные колонки (19% от 21 ранее имевшихся).
Файл проекта 6: [JVP]
Задание 7. "Выравнивание" негомологичных белков
Для выполнения задания я импортировала (Fetch Sequences) последовательности белков из таблицы курса. Их AC: O50105; C7C422; V6F4Q0; P21853; Q9RT63.
Что вполне ожидаемо, после некоторых попыток обрезать последовательности по-разному "хорошего" выравнивания так и не получилось. Что самое важное: нет ни единого участка, который можно было бы назвать вертикальным блоком. Однако же, выделив три из последовательностей в отдельную группу, можно заметить некоторые участки, которые выровнялись относительно неплохо. (Если пренебречь тем, что блок обязан начинаться и кончаться абсолютно консервативной колонкой, процентным содержанием абсолютно консервативных колонок в блоке и т.д.).
Можно поподробнее рассмотреть один из немногих "блоков". Длина — 5, абсолютно консервативная колонка единственная(20%), две функционально консервативных(40%).
Также, выделив один длинный участок 169-420 без блоков (впринципе, там почти всё занято такими участками), проанализируем количество гэповых позиций.
Итак,
Длина участка: 252
Число гэповых позиций: 231
Процент гэповых позиций: 91.67%
Полученные числа подтверждают бессмысленность выравниваний в случае негомологичных последовательностей. А найденные "блоки" так и остатся в кавычках, ибо потребовалось не только сузить круг рассматриваемых последовательностей до трёх, но и пренебречь некоторыми достаточно важными, хоть и техническими, критериями в определении блока. Так что этот контрпример подтверждает следующее: очень мала вероятность того, что мы случайным образом берём из банка несколько последовательностей и получаем стройное выравнивание с вертикальными блоками, малым количеством гэпов и большим процентом консервативных позиций. Скорее всего получится нечто похожее на то, что мы увидели в этом задании.
Файл проекта 7: [JVP]