При помощи BLAST производился поиск гомологов белка щелочная фосфатаза из организма Methanosaeta concilii GP6 (YP_004384630.1) Ссылка на запрос в blastp (База данных - RefSeq, Max target sequences - 20000, Gap Existence - 13, Gap Extension - 1)
Всего найдено 6490 последовательностей
Гомологами можно считать 5960 белков, т.к. именно такое количество находок удовлетворяет критериям E-value<0.001 и Query cover не менее 70%.
Васteria: 951, Archaea: 28, Eukaryota: 51 (остальные последовательности, видимо, не приписаны к таксонам)
Задание 2
Ссылка на запрос
Был совершен поиск по таксону Archaea
Для последовательности из задания 1 (удостовериться в том, что это та же посл-ть, можно по ее ID: WP_014585723.1) выравнивание не изменилось, однако E-value стало 6e-149 (был 5e-147), Bit-score не изменился.
E-value уменьшилось, так как банк тоже уменьшился (E-value прямо пропорционально длине банка).
Можно увидеть разрывы в линии, соответствующие гэпам, а в остальном последовательности очень похожи на всем их протяжении.
Задание 4
Рис2. Выравнивания, построенные на сервере kodomo
Таблица 2. Описание лучшей находки
Выравнивание
Длина выравнивания
Bit score
E-value
Процент сходных колонок
Процент идентичных колонок
Гэпы
ETHHY
37
15.8
2.0
43%
24%
0%
Эти данные вряд ли могут свидетельствовать о гомологии, т.к. E-value значение велико, длина выравнивания очень мала по сравнению с длиной Query, Bit-score также очень мал.