Для данного задания выбрал домен PF19294, DACZ_N. Это специфическая диаденилат циклаза, которая катализирует конденсацию 2 молекул АТФ в циклический ди-АМФ. Выравнивание seed содержит 44 последовательности. В Jalview выбрал порог идентичности 80%. Количество последовательностей не уменьшилось.
Для описания мотива был составлен следующий паттерн: R[IV]RF[GA][IVL]EGA
Он был найден в 29 последовательностях.
Паттерн в формате Prosite: R-[IV]-R-F-[GA]-[IVL]-E-G-A. По данному паттерну осуществлялся поиск мотивов в других белках SwissProt при помощи ScanProsite. Нашлось 1 совпадение в 1 последовательности. Это говорит о том, что данный паттер зарактерен только для узкой группы организмов.
Для последовательностей seed из предыдущего задания в Jalview с помощью алгоритма NJ построил филогенетическое дерево. Для одной из клад, состоящей из 12 белков, нашел мотив, описывающийся следующим паттерном: M[AD]GLDDVFG. По этому паттерну по всем последовательностям нашлось 11 белков (в 1 из 12 последовательностей этого мотива не было). Поэтому мотив в этой кладе специфичен для нее и не встречается в остальных последовательностях.
Для данного задания выбрал белок HPF из организма Synechocystis sp. (AC: P74518). Это фактор активации гибернации рибосом. Участвует в димеризации активных 70S-рибосом в 100S-рибосомы в стационарной фазе. Для этого белка запустил PSI-BLAST по банку Swiss-Prot. После третьей итерации результаты не менялись. Привожу таблицу с результатами.
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
---|---|---|---|---|---|
1 | 24 | P33987.1 | 3,00E-05 | - | - |
2 | 28 | P9WMA8.1 | 4,00E-06 | - | - |
3 | 28 | P24694.1 | 2,00E-20 | - | - |
4 | 28 | P24694.1 | 2,00E-20 | - | - |
После третьей итерации результаты хорощо сошлись - все находки с E-value выше порога. Следовательно, разница E-value между худшей "правильной" находкой и лучшей "неправильной" составляет около 17 парядков. Поэтому очень вероятно, что найденная группа образует семейство гомологичных белков.