1а. Вертикальные блоки
Блоки - прямоугольники, в столбцах которых можно ожидать гомологию аминокислотных остатков из разных последовательностей. Я построила выравнивание 5 белков (GCSH_CYAP8, F3YXR1_DESAF, G5KG81_9STRE, H2NRK9_PONAB и G3H9F6_CRIGR) и выделила в нем 4 вертикальных блока, которые обозначила символом B.
1b. Один блок из части последовательностей
Две из пяти данных последовательностей я считаю более схожими между собой, чем остальные. Я объединила их в одну группу и раскрасила так же, как выравнивание. Символом H выделен участок, на котором в пределах группы все остатки с очень высокой вероятностью гомологичны, а за пределами группы эта вероятность снижается.
2.Число и процент абсолютно и абсолютно функуионально гомологичных позиций
Для подсчета был выбран блок с координатами 107-111
Позиции | Количество | Процент |
Абсолютно консервативные | 0 | 0% |
Абсолютно функционально консервативные | 3 | 60% |
3.Число и процент позций с гэпами для самого длинного участка выравнивания, не входящего в блок
Самый длинный участок выравнивани, не входящий в блок лежит в координатах 35-75. Он содержит 15 позиции с гэпами, что составляет 36,6% от общего числа позиций(41).
4. Консенсусная последовательность и лого блока
Консенсусная последовательность — усредненная нуклеотидная или аминокислотная последовательность, которая регулярно встречается в данном генетическом элементе. Для получения данной последовательности для блока 107-111 я сохранила выравнивание в формате FASTA и воспользовалась программой cons на сервере http://emboss.bioinformatics.nl/. Для получения LOGO блока я использовала сервис http://weblogo.threeplusone.com/, который принимает на вход совокупность выровненных последовательностей и выдает нужное изображение. При этом на изображении гидрофобные аминокислоты выделяются черным, гидрофильные синим, а нейтральные зеленым.5. Паттерн блока
Паттерн для блока 107-111: [WYF]-[LIV]-x-[KVP]-[VLM]
6.Выравнивание с негомологичной последовательностью
Для данного задания я использовала часть последовательности моего белка, очевидно не гомологичную пяти последовательностям, исследуемым ранее. В результате выравнивания было надено несколько консервативных колонок, но при это качество выравнивания остается низким.
7. Выравнивание заведомо неродственных белков
Я выбрала 5 случайных белков из списка и создала выравнивание согласно предыдущей схеме. В полученном выравивании не было обнаружено ни одного блока. Среди 147 колонок только 11 являются абсолютно функционально консервативными (7,5%), из них только 6 (4,8%) абсолютно консервативные. Качество данного выравнивани очень низкое: в нем мало консервативных позиций и много гэпов. Все это свидетельствует об отсутствии гомологии.
Также можно посмотреть все полуенные выравнивания в JalView-проекте: Проект в формате JVP