Учебный сайт Ивановой Софьи

Главная Первый семестр Второй семестр Ссылки Обо мне Контакты

Практикум 8. Введение в выравнивания.

Для выполнения заданий было взято множественное выравнивание №08.

Файл в виде проекта программы Jalview доступен по ссылке

Задание 1.

Были получены изображения выравнивания с раскраской BLOSUM62 с порогом консервативноcти 30 и ClustalX. Последовательности в выравнивании отсортированы по сходству согласно дереву (рис.5). См. рис 1, 2.

Задание 2 a,b,c. Поиск участков выравнивания, на которых можно ожидать гомологию аминокислотных остатков из разных последовательностей.

Результаты задания приведены в строке разметки “blocks” на рис.1 и 2 :


Рис.1 Данное выравнивание в раскраске BLOSUM62 с порогом консервативноcти 30. Вертикальные блоки отмечены буквой B, участки между блоками, входящими в кластеры – буквой C. Самый длинный участок, не входящий в состав блоков и кластеров, показан буквой X.




Рис.2 То же в раскраске ClustalX.


Задание 2d.

Требовалось найти участок, на котором остатки двух или более последовательностей, предположительно, гомологичны, а остатки остальных - скорее негомологичны им (точнее, нет данных за их гомологичность). То есть те колонки, в которых есть пары остатков, предположительно гомологичные между собой, а также остатки, о гомологии которых с первыми нет достаточных сведений. Я нашла наиболее близкие друг к другу последовательности (это ROSHA и EUBR3) с помощью дерева, и искала в них идентичные участки, приходящиеся на места в общем выравнивании, не принадлежащие блоками или кластерам.

Результаты приведены на рис.3



Рис.3 Результаты задания 2d. Один из участков, на котором остатки двух последовательностей - и - предположительно, гомологичны, а остатки остальных - скорее негомологичны им.




Рис.4 Еще один такой участок.

Аргументы в пользу гомологии отдельных остатков в данных последовательностях - большое сходство этих двух последовательностей (ROSHA и EUBR3) между собой при относительно слабом сходстве с другими последовательностями (согласно построенному ранее дереву, см. рис.5).



Рис.5 Дерево родства данных последовательностей.


Задание 3.

Был выбран вертикальный блок 17-40. Его длина составляет 24 аминокислотных остатка. Результаты приведены в таблице 1.

Рис.6 Вертикальный блок, для которого выполнялись расчеты в задании 3.



Таблица 1. Результаты задания 3.

Предмет подсчета Число Процент
Абсолютно консервативные позиции 6 25%
Абс. функционально консервативные позиции 13 54%
Конс-ые и функционально конс-ые на 70% позиции 20 83%

Также требовалось подсчитать число и процент позиций с гепами для самого длинного участка выравнивания, не входящего в состав блоков и кластеров. Был взят участок 41-53. Результаты: 2 гэпа, всего 13 позиций, итого 15%.

Задание 4.

Требовалось вручную вписать последовательность №08 в выравнивание. Результаты приведены на рис. 7.

Рис.7 В выравнивание вписана последовательность GEOKA.


Задание 5.

Требовалось вписать заведомо негомологичную последовательность в выравнивание. Была взята последовательность белка precorrin-8X methylmutase из Picrophilus torridus, археи, с которой я работала в первом семестре (случайный белок подходящей длины из списка последовательностей белков этой археи). Результаты приведены на рис.8.

Рис.8 Размещение заведемо негомологичной последовательности.


Лучший достигнутый результат - 20 совпадений в абсолютно функционально консервативных позициях из 140 всех позиций, т.е примерно 14%. Было получено не больше 2 совпадений в абсолютно консервативных колонках во всех испробованных выравниваниях.

Задание 6.

Требовалось построить множественное "выравнивание" заведомо негомологичных (не родственных) белков. Было взято 5 последовательностей белков, с которыми работали в первом семеств другие студенты. Идентификаторы этих аминокислотных п-тей в БД UniProt: A9F087, F2LXL4, B1Y8F1, F4GF31, F7YW52. Данные последовательности были импортированы из базы данных в программу, и с помощью веб-сервиса было построено множественное выравнивание. Результаты представлены в окне task6 приложенного файла. Требовалось также найти два самых лучших "блока", включающих не менее половины последовательностей. Результаты представлены на рис. 9 и 10.



Рис. 9 Один из двух найденных "лучших блоков"



Рис. 10 Второй из двух найденных "лучших блоков"

В данном выравнивании не было найдено вертикальных блоков, включающих все 5 последовательностей, сколько-нибудь существенной длины. Были получены относительно короткие вертикальные блоки для трех последовательностей. Самый длинный блок составлял 12 аминокислот (рис.10). Наличие таких блоков в заведомо негомологичных последовательностях объясняется, по-видимому, тем, что это функциональные домены, встречающиеся в многих белках и имеющие более-менее консервативную структуру, приспособленную для выполнения своей задачи. Такие домены могут, например, связывать определенное вещество или обеспечивать повороты и другие неспецифические третичные структуры белковой цепи.



© Иванова Софья