Практикум 10 Анализ множественных выравниваний
1a. Вертикальные блоки. Блок это прямоугольник в выравнивания, для которого предполагается гомология между остатками из всех последовательностей, входящих в блок, для каждой колонки блока. Было построенно выравнивание из 5 последовательностей белков (E9GNX0_DAPPU; G3PH15_GASAC; Q11NC0_CHESB; F2LH93_BURGS; C7NI14_KYTSD) и выделено 4 блока, они обозначенны буквой B.
Рис. 1. Изображение выравнивания, полученного в задании 1а.1b.Один блок из части последовательностей.Блок это прямоугольник в выравнивания, для которого предполагается гомология между остатками из всех последовательностей, входящих в блок, для каждой колонки блока. Был выделен 1 блок и раскрашен также как группа, он обозначен буквой H. В этом блоке 2 абсолютно консервативных позиции 50%.
Рис. 2. Изображение выравнивания, полученного в задании 1b.2a. Число и процент абсолютно консервативных позиций и абсолютно функционально консервативных позиций. Подсчитано для блока с координатами: 54-61
Позиция | Число | Процент |
Абсолютно консервативная | 4 | 50% |
Абсолютно функционально консервативная | 7 | 87,5% |
2b.Число и процент позций с гэпами для самого длинного участка выравнивания, не входящего в блок. Самый длинный участок выравнивани имеет координаты: 1-53. Он содержит 51 позицию с гэпами, что составляет 96,2% от общего числа позиций (53).
Рис. 3. Изображение выравнивания, полученного в задании 2b.
4. Консенсусная последовательность и лого блока. Для получения консенсусной последовательности, я сохранила блок с координатами 54-61 в fasta. Затем программой cons на сервере http://emboss.bioinformatics.nl/ получена необходимая последовательность. Ссылка на консенсусную последовательность. . Для получения LOGO блока был использован сервис http://weblogo.threeplusone.com/, который принимает на вход совокупность выровненных последовательностей и выдает нужное изображение. При этом на изображении гидрофобные аминокислоты выделяются черным, гидрофильные синим, а нейтральные зеленым.
5. Паттерн выбранного блока. Паттерн для блока с координатами 54-61: [FY]-T-[DE]-X-H-E-W-[LI]
6.Выравнивание с негомологичной последовательностью. Была взята часть последовательности моего белка Metallophosphoesterase организма Clostridium thermocellum (strain ATCC 27405 / DSM 1237) (Ruminiclostridium thermocellum), негомологичная остальным 5ти, и построено выравнивание. Было найдено 12 совпадений с абсолютно функционально консервативными блоками, что составляет 13% от общего числа позиций в блоках.
Рис. 4. Изображение выравнивания, полученного в задании 6.7. Выравнивание заведомо неродственных белков Было взято 5 случайных последовательностей из списка с идентификаторами (NP_809341.1; NP_603408.1; NP_820762.2; NP_295013.1; NP_274428.1) и построено выравнивание. Было найдено два блока, включающие 3 из 5 последовательности. Среди колонок только 3 абсолютно консервативные и 15 абсолютно функционально консервативных (составляет 1,5% от общего числа колонок 966). Качество этого выравнивания очень низкое, так как в выравнивании мало консервативных позиций и много гэпов.
Рис. 5. Изображение выравнивания, полученного в задании 7.
Ссылки:
© Кузнецова Ксения, 2015