В этом практикуме я использовала домен SureE из моего белка Q9PF20 (
Xylella fastidiosa (strain 9a5c)).
На
Pfam
я нашла
файл с полными последовательностями белков, содержащих этот же домен.
Из него я выбрала 70 (максимум для выравнивания Jalview 1000 последоватльностей).
Далее последовательности одного семейства в Jalview я выровняла и покрасила с помощью ProbconsWS with default Clustal.
Из 70 последовательностей я оставила 11, удалив очень похожие (identity > 90%) и те, у которых были большие вставки (использовалась функция
Jalview Sort by pairwise identity).
Конечное выравнивание, которое получилось, вы можете посмотреть
здесь.
Блоками в выравнивании я считала консервативные участки длиной больше 6 а.о., с высокой степенью схожести, начинающихся и заканчивающихся консервативными
колонками и не имеющие гэпов. В итоге, получилось 5 блоков. Первые два блока находятся на небольшом расстоянии друг от друга (5 позиций), что
свидетельствует о гомологии этих белков. Блоки 2, 3, 4 и 5 находятся уже на большем расстоянии друг от друга (около 40-45), но блоки 3 и 5 имеют достаточно
большую длину, что, по моему мнению, не мешает говорить о гомологичности последовательностей.
Кроме того, можно сказать что блоки 3 и 4 являются наиболее консервативными относительно остальных блоков.