В этом практикуме я работала с семейством белков теплового шока - HSP70 (PF00012). Эти белки помогают клетке переживать физиологические стрессы, в т.ч. тепловые. Их функция состоит в облегчении сворачивание сложных белков и стабилизировании частично свернутые белки. Помимо этого, они способствуют транспорту этих белков через мембрану. Белки теплового шока разделяют по размеру на три группы: Hsp60, Hsp70 и Hsp90. Выбранная мной группа Hsp70 содержит белки размером 70 кДа. Самые изученные из них - HSP70, Bip, и DnaK -- группа АТФ-зависимых шаперонов.
Все белки этой группы имеют следующую структуру: N-конец представляет собой АТФазный домен, а С-конец - область связывания субстрата.
Поиск в базе Pfam велся по ключевому слову: AMP-binding protein. Выравнивание seed содержит 27 последовательностей.
В качестве мотива была выбрана белковая последовательность со следующим паттерном: N[DE][PTV]TA[AV][AGS].[AS]YG. Она встречается в 26 из 27 последовательностей, при чем в каждой только один раз. На уровне совпадения 100% был найден наиболее консервативный участок - [175:185]. На Рис. 1 видно, что даже на уровне совпадения 85% участок является консервативным в большинстве последовательностей.
Использую сервис MyHints для поиска белков в базе данных Swiss-Prot, было обнаружено 1045 находок, содержащих данных домен. Из них 866 принадлежат к группе Heat shock protein, а еще 179 находок -- к группе гомологов шаперона HscA. Из полученных данных можно заключить, что выбранный мотив отвечает за связывание с белками, чью структуру меняет шаперон.
Используя алгоритм NJ, было получено филогенетическое дерево, представленное на Рис. 2:
Далее была выбрана группа, выделенная зелёным, в неё входит 8 последовательностей. В группе был выбран высоко консервативный участок [95:100], несущий паттерн [NT]GDAW[VL]. В других группах подобный паттерн не обнаружен, а в шести последовательностях на участке [95:100] - только гэпы. Видимо, данный паттерн является спицифичным для выбранной группы.
Мною был выбран белок Spinacia oleracea, учавствующий в ингибировании трансляции за счет связывания с рибосомой.
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
---|---|---|---|---|---|
1 | 17 | P30334.1 | 0.004 | Q0C0T0.1 | 0.027 |
2 | 28 | P9WMA8.1 | 0.003 | Q0C0T0.1 | 0.027 |
3 | 28 | P9WMA8.1 | 7E-13 | Q0C0T0.1 | 0.027 |
4 | 28 | P9WMA8.1 | 8E-13 | Q0C0T0.1 | 0.027 |
Для выполнения этого задания я работала с референсным геномом Mycobacterium tuberculosis H37Rv. Ожидаемое число TA в геноме оказалось равным 130400 с учетом GC-состава, а наблюдаемое - 74604. Для оценки статистической значимости использовался Χ-квадрат тест. Полученное P-value равно 0, из чего можно заключить, что различие значимо.