Анализ множественных выравниваний
Исходные данные
Дано множественное выравнивание последовательностей с идентификаторами:
Вертикальные блоки
Вертикальный блок — это участок множественного выравнивания, обладающий следующими свойствами:
Дано множественное выравнивание последовательностей с идентификаторами:
Вертикальный блок — это участок множественного выравнивания, обладающий следующими свойствами:
Вертикальные блоки обозначены в выравнивании символом "B" в строке разметки "Vertical blocks". Таких блоков три, как видно из рис. 1.
![]() |
Рис. 1. Изображение вертикальных блоков |
Из данных 5-ти последовательностей был выделен блок, содержащий 2 последовательности с идентификаторами A0A0C5WMF1_9GAMM, A6TMY7_ALKMQ и C5AUG1_METEA. Участков с консервативными или абсолютно консервативными позициями здесь было выделено 5 (они обозначены символом "H" в строке разметки "groups") ,и они длиннее, чем вертикальные блоки пяти последовательностей. Таким образом, можно с высокой вероятностью говорить о гомологичности остатков в столбцах блока с двумя последовательностями. Однако нельзя утверждать то же и для других последовательностей, так как в некоторых позициях столбцов с символом "H" в двух других последовательностях стоят негомологичные остатки.
![]() |
Рис. 2. Один блок из части последовательностей |
Для выполнения данного задания был выбран блок из трех последовательностей с координатами 55-83. Всего в нем 29 позиций. Из них абсолютно консервативных (одинаковые аминокислоты) - 18. Функционально консервативных -6.
![]() |
Рис. 3. Участок блока из трех последовательностей |
Число | Процент | |
Абсолютно консервативные позиции | 18 | 62,1% |
Абсолютно функционально консервативные позиции | 6 | 20,7% |
Для подсчета числа и процента позиций с гэпами был выбран участок длиной 35 позиций (отмечен символами "X")
![]() | |
Рис. 4. Самый длинный участок без блоков (обозначен "X") |
Здесь находится 3 позициии с гэпами, что составляет 8,6%.
Консенсусная последовательность (consensus sequence) — обобщенная нуклеотидная последовательность , выведенная на основании сравнения ряда отдельных последовательностей, выполняющих сходные функции в различных локусах генома, похожих друг на друга, но различающихся в деталях [1].
Для поиска консенсусной последовательности был выбран блок из трех последовательностей с координатами 55-83 . Консенсус был скопирован из JalView:
>Consensus/1-29 Percentage Identity Consensus GEDAAVVESVKAASDIYAPLSGEVIEVNE |
LOGO белка — графичкское представление выравнивания, разработанное Томом Шнайдером и Майком Стефенсом. LOGO состоит из набора символов аминокислотных остатков. Общая высота указывает на сохранение последовательности в таком положении, высота конкретного сивола определяет его относительную частоту в данной позиции. По умолчанию аминокислотные остатки окрашиваются по гидрофобности. Гидрофобные — черным, гидрофильные — синим, а нейтральные — зеленым.
Для получения LOGO был использован сервис WebLogo. LOGO построено для блока из трех последовательностей с координатами 55-83.
![]() | |
Рис. 5. LOGO блока с координатами 55-83 |
Паттерн для блока из трех последовательностей с координатами 55-83:
G-[ED]-[DA]-[ACF]-[AG]-V-[VA]-E-S-V-K-A(2)-S-D-[ILV]-Y-[AI]-P-L-S-G-[EFT]-V-[ITV]-[EA]-[VI]-N-E
В качестве дополнительной последовательности была выбрана последовательность белка рубреритрина (Q9UWP7_9EURY), которая являлась заведомо негомологичной исходным пяти. Однако удалось обнаружить 1 блок. Следует отметить, что из-за того, что исходные 5 последовательностей содержали мало консервативных колонок, то и при добавлении еще одной их стало еще меньше.
В найденном блоке содержится 2 абсолютно функуионально конcервативные колонки, что составляет 40% блока.
![]() | |
Рис. 6. Выравнивание с последовательностью Q9UWP7_9EURY |
Таким образом, можно сделать вывод о том, что можно "выровнять" любые последовательности (в них даже можно будет найти блоки). Однако говорить о гомологичности последовательностей исходя из наличия 1-го блока небольшого размера, конечно, нельзя.
Для этого задания ыли взяты белки со следующими идентификаторами:
![]() | |
Рис. 5. Множественное выравнивание заведомо негомологичных белков |
Как видно из рис.5 вертикальных блоков для выравнивания данных последовательностей нет. Есть один блок длиной 4 а.о. для пяти последовательностей из шести.
Для данного блока приведена характеристика в табл.2:
Число | Процент | |
Абсолютно консервативные позиции | 1 | 25% |
Абсолютно функционально консервативные позиции | 1 | 25% |
Тааким образом, полученное выравнивание подтверждает негомологичность выбранных белков.
1. Свердлов Е.Д. Взгляд на жизнь через окно генома. Т. 1. Москва. 2009
© Васильева Елена, 2015