Практикумы 8. Сигналы и мотивы - 3

1. Консервативный мотив в белковых последовательностях

В этом практикуме я работала с семейством белков теплового шока - HSP70 (PF00012). Эти белки помогают клетке переживать физиологические стрессы, в т.ч. тепловые. Их функция состоит в облегчении сворачивание сложных белков и стабилизировании частично свернутые белки. Помимо этого, они способствуют транспорту этих белков через мембрану. Белки теплового шока разделяют по размеру на три группы: Hsp60, Hsp70 и Hsp90. Выбранная мной группа Hsp70 содержит белки размером 70 кДа. Самые изученные из них - HSP70, Bip, и DnaK -- группа АТФ-зависимых шаперонов.

Все белки этой группы имеют следующую структуру: N-конец представляет собой АТФазный домен, а С-конец - область связывания субстрата.

Поиск в базе Pfam велся по ключевому слову: AMP-binding protein. Выравнивание seed содержит 27 последовательностей.

В качестве мотива была выбрана белковая последовательность со следующим паттерном: N[DE][PTV]TA[AV][AGS].[AS]YG. Она встречается в 26 из 27 последовательностей, при чем в каждой только один раз. На уровне совпадения 100% был найден наиболее консервативный участок - [175:185]. На Рис. 1 видно, что даже на уровне совпадения 85% участок является консервативным в большинстве последовательностей.


Рисунок 1. Участок выравнивания с окрашиванными совпадениями для 85% последовательностей и более

Использую сервис MyHints для поиска белков в базе данных Swiss-Prot, было обнаружено 1045 находок, содержащих данных домен. Из них 866 принадлежат к группе Heat shock protein, а еще 179 находок -- к группе гомологов шаперона HscA. Из полученных данных можно заключить, что выбранный мотив отвечает за связывание с белками, чью структуру меняет шаперон.


2. Мотив, специфичный для клады

Используя алгоритм NJ, было получено филогенетическое дерево, представленное на Рис. 2:

Рисунок 2. Филогенетическое дерево выбранной клады белков

Далее была выбрана группа, выделенная зелёным, в неё входит 8 последовательностей. В группе был выбран высоко консервативный участок [95:100], несущий паттерн [NT]GDAW[VL]. В других группах подобный паттерн не обнаружен, а в шести последовательностях на участке [95:100] - только гэпы. Видимо, данный паттерн является спицифичным для выбранной группы.

Рисунок 3. Последовательности с поиском по паттерну [NT]GDAW[VL]

3. PSI-BLAST

Мною был выбран белок Spinacia oleracea, учавствующий в ингибировании трансляции за счет связывания с рибосомой.

Номер итерации Число находок выше порога (0,005) Идентификатор худшей находки выше порога E-value этой находки Идентификатор лучшей находки ниже порога E-value этой находки
1 17 P30334.1 0.004 Q0C0T0.1 0.027
2 28 P9WMA8.1 0.003 Q0C0T0.1 0.027
3 28 P9WMA8.1 7E-13 Q0C0T0.1 0.027
4 28 P9WMA8.1 8E-13 Q0C0T0.1 0.027
4. Встречаемость ТА в геноме

Для выполнения этого задания я работала с референсным геномом Mycobacterium tuberculosis H37Rv. Ожидаемое число TA в геноме оказалось равным 130400 с учетом GC-состава, а наблюдаемое - 74604. Для оценки статистической значимости использовался Χ-квадрат тест. Полученное P-value равно 0, из чего можно заключить, что различие значимо.