КОНСЕРВАТИВНЫЙ МОТИВ В ВЫРАВНИВАНИИ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ГОМОЛОГИЧНЫХ БЕЛКОВ

В рамках данного практикума было выбрано семейство трипсинов. Seed для этого семейства содержит 70 последовательностей. Выравнивание этих последовательностей было октрыто в JalView и в качестве консервативного мотива был выбран мотив GDSGGP (Рис 1), который встречается в 42 последовательностях. В остальных последовательностях имеется по одной или две замены. С использованием сервиса MyHints был произведен поиск выбранного мотива в базе данных SwissProt. Было получено 658 находок среди которых встречаются как и трипсины, так и сериновые протеазы из других семейства. Например, химотрипсины. Но и многие находки вовсе оказались не протеазами.

ПОИСК МОТИВА СПЕЦИФИЧНОГО ДЛЯ КЛАДЫ

Для полученного ранее выравнивания было построено филогенетическое дерево методом NJ и выделена клада из 12 последовательностей. Для них был найден специфичный мотив [IL]-Q-[TL]-DA, встречающийся в 11 последовательностях, который не был найден в последовательностях за пределами клады.

PSI-BLAST

Для работы был выбран белок Spinacia oleracea, учавствующий в ингибировании трансляции за счет связывания с рибосомой. Идентефикатор P19954

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 17 P30334.1 0.004 Q0C0T0.1 0.027
2 28 P9WMA8.1 0.003 Q0C0T0.1 0.027
3 28 P9WMA8.1 7E-13 Q0C0T0.1 0.027
4 28 P9WMA8.1 8E-13 Q0C0T0.1 0.027

ПРОВЕРКА ЧИСЛА TA В ГЕНОМЕ БАКТЕРИИ

В рамках этого задания я работал с референсным геномом Mycobacterium tuberculosis H37Rv. Ожидаемое число TA в геноме оказалось равным 130400 с учетом GC-состава, а наблюдаемое окзалось 74604. Для оценки статистической значимости использовался хи-квадрат тест и p-value оказалось 0, соответственно различие значимо.