Эволюционные домены. Банки Pfam и InterPro.

Доменная структура белка KAD_BACSU по данным Pfam

Cхема из Pfam:
Схема показывает наличие внутри одного домена (ADK, выделенного зеленым) другого домена (ADK_lid, выделенного красным) обеспечивающего функциональность.
Pfam AC Pfam ID Название семейства доменов Положение в последовательности белка KAD_BACSU Клан
1. PF00406   ADK
Домен, включающий почти весь белок.
5-191 Кдан P-loop_NTPase (CL0023) включает 198 семейств.
2. PF05191   ADK_lid
Сайт связывания АТФ.
127-162 -

Подробнее о домене ADK_lid

Среди lid-доменов аденилаткиназ аблюдается дивергенция. У некоторых организмов, например, Грам-положительных бактерий, аминокислотные некоторые остатки этого домена мутируют в цистеин, который связывает ион цинка. Участок связывания иона цинка в lid-домене структурно гомологичен так называемым цинковым пальцам. Однако неясно, связывается ли аденилаткиназа с ДНК и РНК с помощью этого домена, или он не имеет особенной структурной функции.
ADK_lid входит в 17 архитектур, последовательности известны для 6210 белков, содержащих домен.
Пространственная структура определена для 40 разных белков, содержащих домен.
Взглянем на выравнивание фрагментов последовательностей, содержащих lid-домен (рисунок 1). На мой взгляд, выравнивание достоверно и вполне подтверждает гомологичность доменов. В этом файле содержится выравнивание в fasta-формате.

Рисунок 1.Фрагмент множественного выравнивания доменов ADK_lid, с использованием моей цветовой схемы и функции by conservation.

Встречаемость доменов у разных групп организмов

Поскольку домены моего белка встречаются у слишком большого количесвта видов и филогенетическое дерево не может быть получено, пришлось взять другой белок. Это будет белок GBRA6_MOUSE (P16305), включающий как раз два домена, для которых строются деревья.

Рисунок 2.Архитектура белка GBRA6_MOUSE.

Таксон
Количество белков с доменом PF02931
Количество белков с доменом PF02932
Эукариоты Зеленые растения 3 4
Грибы 0 0
Животные 5807 5477
Остальные эукариоты 17 13
Археи 0 1
Бактерии 57 22
Вирусы 0 0

Стоит отметить, что белок GBRA6 или "GABA(A) receptor, alpha 6" является составной частью ионных каналов GABA-рецепторов, поэтому его домены чаще всего встречаются у животных.

Описания мотивов в разных банках семейств, по данным InterPro

Посмотрим какие сведения о белке KAD_BACSU есть в базе данных InterPro, которая содержит записи из нескольких баз данных (Pfam, PROSITE, TIGERFAMs, PRINTS, BLOCKS и др.)

Рисунок 3. Записи о мотивах в последовательности KAD_BACSU.

Самый короткий мотив ADENYLATE_KINASE описан в банке PROSITE patterns (PS00113). Его координаты в последоваетльности: 81-92.
Самый длинный мотив SSF52540 описан в банке SUPERFAMILY (SSF52540), располагается 1 по 215 аминокислоту, на рисунке показан зеленым.
В InterPro интегрированы две структурные подписи: P-loop containing nucleoside triphosphate hydrolase (IPR027417) (P-loop_NTPase) и Adenylate kinase, active site lid domain (IPR007862) (Adenylate_kinase_lid-dom).
Второй домен не отличается от записи в банке Pfam, а первый отличается. В банке Pfam он охватывает весь белок с 1 по 217 аминокислоту, а в InterPro только по 215, и называется он по-другому.

Главная страница Первый семестр Второй семестр Обо мне Ссылки

© Марк Меерсон, 2013
Последнее обновление: 09.05.2013