Анализ множественных выравниваний |
|||||||||||||||||||||
Главная | Обо мне | Официальный сайт ФББ | Семестр I | Семестр II | Семестр III | ||||||||||||||||
Для выполнения данной работы я использовала построенное c помощью программы JalView в предыдущем практикуме выравнивание последовательностей Uniprot со следующими идентификаторами:
Задание 1. Поиск блоков в выравниванииИспользуемое техническое определение
1а. Выделение вертикальных блоков 1b. Один блок из части последовательностей Задание 1 в проекте JalView Задание 2. Статистика2a. Число и процент консервативных позиций
2b. Число и процент позиций с гепами для самого длинного участка, не входящего в состав блоков Задание 3. Консенсусная последовательность и LOGO одного блокаКонсенсусная последовательность (consensus/canonical sequence) - некая усредненная последовательность
(возможны небольшие вариации в аминокислотных или нуклеотидных остатках). Обычно характерна для генов, кодирующих один и тот же белок у разных организмов, т.к. ее
составляют наиболее часто встречающиеся нуклеотиды/аминокислоты. Консенсусная последовательность создается на основе массива выравнивания, часто является эталонной
в анализе.[1] Задание 4. Паттерн для выбранного блокаПаттерн для блока с координатами 60-68: L-G-[ED]-[IV]-V-[YF]-[VFC]-[DQSE]-[VL]. Задание 5. Выравнивание с заведомо негомологичной последовательностью белка NP_809341.1Построение искусственного выравнивания данных последовательностей с полседовательностью белка бактероида показало, что максимальное число совпадений негомологичной последовательности с консервативными позициями в блоках равно 14. В пересче в проценты - около 29%, что все же свидетельствует о малой вероятности гомологичности белков, а следовательно, о дальних систематических связях организмов, у которых они встречаются. Совпадения в разметке False coincidence обозначены буквой F. Задание 6. "Выравнивание" заведомо негомологичных белковПопытка построить выравнивание для неродственных белков с указаннами идентификаторами (NP_820762.2; NP_603408.1; NP_354235.1; NP_354235.1; NP_274428.1; NP_228195.1) оказалось неудачной: получилось слишком много гэпов, не удалось найти ни одной абсолютно консервативной колонки, количество абсолютно функциональных колонок тоже было недостаточным для построения хорошего выравнивания. Количество полученных блоков - 3. Таким образом, можно убедиться в том, что метод выравнивания последовательностей действительно отражает гомологичность в биологическом понимании термина. Две наиболее похожие последовательности мне удалось объединить в группу, для этого в блоке с координатам 397-400 я выбрала подблок из 2 последовательностей, опираясь на то, что в них есть 3 абсолютно консервативные позиции, но при рассмотрении этих же колонок для совокупности всех последовательностей, то исчезают абсолютно консервативные колонки, 398 колонка (для 6 последовательностей) не является даже абсолютно функционально консервативной, то есть, чем меньше последовательностей в "выравнивании", тем легче найти "гомологичные учаски". Задание 6a в проекте JalViewЗадание 6b в проекте JalView Для выполнения этой части задания я рассмотрела блок с координатами 397-400 (из 4 колонок).
Максимальный участок, не образующий блоков, состоит из 385 колонок (координаты 12 - 396)
Число позиций с гэпами - 64, что составляет 16.62%, данный показатель значительно меньше аналогичного в хорошем выравнивании. Источники:[1]База знаний по биологии человека[2] Руководство к JalView [3] www.bioinformatics.nl/emboss-explorer/ [4] http://weblogo.threeplusone.com/ [5] UniProt |
© Marina Gladkova, 2016