Практикум 10

1. Консервативный мотив в выравнивании последовательностей гомологичных белков

Для данного задания выбрал домен PF19294, DACZ_N. Это специфическая диаденилат циклаза, которая катализирует конденсацию 2 молекул АТФ в циклический ди-АМФ. Выравнивание seed содержит 44 последовательности. В Jalview выбрал порог идентичности 80%. Количество последовательностей не уменьшилось.

Для описания мотива был составлен следующий паттерн: R[IV]RF[GA][IVL]EGA

Он был найден в 29 последовательностях.

Паттерн в формате Prosite: R-[IV]-R-F-[GA]-[IVL]-E-G-A. По данному паттерну осуществлялся поиск мотивов в других белках SwissProt при помощи ScanProsite. Нашлось 1 совпадение в 1 последовательности. Это говорит о том, что данный паттер зарактерен только для узкой группы организмов.

2. Мотив, специфичный для одной клады филогенетического дерева

Для последовательностей seed из предыдущего задания в Jalview с помощью алгоритма NJ построил филогенетическое дерево. Для одной из клад, состоящей из 12 белков, нашел мотив, описывающийся следующим паттерном: M[AD]GLDDVFG. По этому паттерну по всем последовательностям нашлось 11 белков (в 1 из 12 последовательностей этого мотива не было). Поэтому мотив в этой кладе специфичен для нее и не встречается в остальных последовательностях.

3. PSI-BLAST

Для данного задания выбрал белок HPF из организма Synechocystis sp. (AC: P74518). Это фактор активации гибернации рибосом. Участвует в димеризации активных 70S-рибосом в 100S-рибосомы в стационарной фазе. Для этого белка запустил PSI-BLAST по банку Swiss-Prot. После третьей итерации результаты не менялись. Привожу таблицу с результатами.

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 24 P33987.1 3,00E-05 - -
2 28 P9WMA8.1 4,00E-06 - -
3 28 P24694.1 2,00E-20 - -
4 28 P24694.1 2,00E-20 - -

После третьей итерации результаты хорощо сошлись - все находки с E-value выше порога. Следовательно, разница E-value между худшей "правильной" находкой и лучшей "неправильной" составляет около 17 парядков. Поэтому очень вероятно, что найденная группа образует семейство гомологичных белков.