КОНСЕРВАТИВНЫЙ МОТИВ В ВЫРАВНИВАНИИ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ГОМОЛОГИЧНЫХ БЕЛКОВ
В рамках данного практикума было выбрано семейство трипсинов. Seed для этого семейства содержит 70 последовательностей. Выравнивание этих последовательностей было октрыто в JalView и в качестве консервативного мотива был выбран мотив GDSGGP (Рис 1), который встречается в 42 последовательностях. В остальных последовательностях имеется по одной или две замены. С использованием сервиса MyHints был произведен поиск выбранного мотива в базе данных SwissProt. Было получено 658 находок среди которых встречаются как и трипсины, так и сериновые протеазы из других семейства. Например, химотрипсины. Но и многие находки вовсе оказались не протеазами.
ПОИСК МОТИВА СПЕЦИФИЧНОГО ДЛЯ КЛАДЫ
Для полученного ранее выравнивания было построено филогенетическое дерево методом NJ и выделена клада из 12 последовательностей. Для них был найден специфичный мотив [IL]-Q-[TL]-DA, встречающийся в 11 последовательностях, который не был найден в последовательностях за пределами клады.
PSI-BLAST
Для работы был выбран белок Spinacia oleracea, учавствующий в ингибировании трансляции за счет связывания с рибосомой. Идентефикатор P19954
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
---|---|---|---|---|---|
1 | 17 | P30334.1 | 0.004 | Q0C0T0.1 | 0.027 |
2 | 28 | P9WMA8.1 | 0.003 | Q0C0T0.1 | 0.027 |
3 | 28 | P9WMA8.1 | 7E-13 | Q0C0T0.1 | 0.027 |
4 | 28 | P9WMA8.1 | 8E-13 | Q0C0T0.1 | 0.027 |
ПРОВЕРКА ЧИСЛА TA В ГЕНОМЕ БАКТЕРИИ
В рамках этого задания я работал с референсным геномом Mycobacterium tuberculosis H37Rv. Ожидаемое число TA в геноме оказалось равным 130400 с учетом GC-состава, а наблюдаемое окзалось 74604. Для оценки статистической значимости использовался хи-квадрат тест и p-value оказалось 0, соответственно различие значимо.