Эволюционные домены. Банки Pfam и InterPro.

Этот раздел проекта посвящён базе данных Pfam (Protein families), которая содержит информацию о семействах белков - группах белков, являющихся гомологичными. Для таких белков характерно наличие одних и тех же участков консервативности в структуре - эволюционных доменов. Именно описанию таких доменов и уделено внимание последующих подразделов.

Описание доменной архитектуры CISY_BACSU в соответствии с банком Pfam

C помощью опции Jump To, позволяющей производить поиск по любому типу ID белка, был произведён поиск по Pfam. Результат поиска: (RESULT) - страница структуры 2С6X, откуда возможны переходы к другим базам данных и другим типам информации в Pfam. Результаты поиска доменов в белке описаны в таблице 1.

Таблица 1. Доменная структура белка CISY_BACSU
Cхема из Pfam:
Пояснения к схеме:
Pfam AC Pfam ID Полное название семейства доменов Положение в последовательности Клан
1. PF00285 Сitrate_synt Семейство цитратсинтазы из трёх ферментов: цитратсинтазы (EC 2.3.3.1), 2-метилцитратсинтазы (EC 2.3.3.5) и АТФ-цитратлиазы (EC 2.3.3.8). 5 - 352 нет

Краткая характеристика обнаруженного домена

Описание распространённости и частоты встречаемости доменов среди различных организмов

Так как в данном разделе требуется доменная архитектура с двумя доменами, то структура нашего белка не подходит. Возьмём белок, также относящийся к описанному семейству, но имеющий в структуре два домена: это цитратсинтаза из Fusarium oxysporum - почвенного сапротрофа и факультативного паразита из Ascomycota.
Архитектура цитратсинтазы из F. oxysporum:
Видно, что уже описанный домен Сitrate_synt представлен неполностью, а кроме того, присутствует ещё один нецелый домен p450 (PF00067). Белки, его содержащие, образуют большое и разнообразное семейство ферментов, окисляющих различные органические молекулы в клетке (чаще всего катализируют монооксигеназную реакцию) и участвующих в разнообразнейших метаболических путях и каскадах. Иногда приводятся данные о том, что около 75% всех различных между собой катализируемых реакций осуществляются именно такими белками.

Перейдём непосредственно к основной части работы и проанализируем представленность и частоту встречаемости домена у различных групп живых организмов. Результаты представлены в таблице 2.

Таблица 2. Представленность доменов PF00285 и PF00067 в организмах разных таксонов
Таксон Кол-во белков с доменом PF00285 Кол-во белков с доменом PF00067
Eukaryota Viridiplantae 51 442
Fungi 157 337
Metazoa 133 567
Другие Eukaryota 46 68
Archaea 97 25
Bacteria 4603 1532
Viruses 0 0
Всего: 5087 2977 (6 из unclassified prokaryota)

По данным таблицы 2 можно заключить, что цитратсинтазный домен представлен преимущественно у бактерий, а домен p450 представлен одинаково как среди прокариот, так и среди эукариот. Примечательно, что ни один из доменов не встречен у вирусов, что, вероятно, можно объяснить участием обоих в клеточном метаболизме, не относящемся к матричному синтезу.

Сравнение описания мотивов в разных банках семейств (по данным InterPro)

InterPro (integrated resource of protein families, domains and functional sites) представляет из себя единую интегрированную базу данных, охватывающую собой множество различных баз данных, посвящённых семействам белков: Pfam, Prosite, Prints, Blocks, Smart, Superfamily, ProDom, PIRaln, ProClass, Systers, Picasso etc.

Рис. 1 Все подписи (signatures) к последовательности CISY_BACSU, интегрированные в Interpro

Ответы на некоторые вопросы по подписям Interpro:

Дата последнего обновления: 27.05.2013
© Dmitry Travin, 2012