Эволюционные домены. Банки Pfam и InterPro.
Этот раздел проекта посвящён базе данных Pfam (Protein families), которая содержит информацию о семействах белков - группах белков, являющихся гомологичными. Для таких белков характерно наличие одних и тех же участков консервативности в структуре - эволюционных доменов. Именно описанию таких доменов и уделено внимание последующих подразделов.
Таблица 1. Доменная структура белка CISY_BACSU
Видно, что уже описанный домен Сitrate_synt представлен неполностью, а кроме того, присутствует ещё один нецелый домен p450 (PF00067). Белки, его содержащие, образуют большое и разнообразное семейство ферментов, окисляющих различные органические молекулы в клетке (чаще всего катализируют монооксигеназную реакцию) и участвующих в разнообразнейших метаболических путях и каскадах. Иногда приводятся данные о том, что около 75% всех различных между собой катализируемых реакций осуществляются именно такими белками.
Перейдём непосредственно к основной части работы и проанализируем представленность и частоту встречаемости домена у различных групп живых организмов. Результаты представлены в таблице 2.
Таблица 2. Представленность доменов PF00285 и PF00067 в организмах разных таксонов
По данным таблицы 2 можно заключить, что цитратсинтазный домен представлен преимущественно у бактерий, а домен p450 представлен одинаково как среди прокариот, так и среди эукариот. Примечательно, что ни один из доменов не встречен у вирусов, что, вероятно, можно объяснить участием обоих в клеточном метаболизме, не относящемся к матричному синтезу.
Ответы на некоторые вопросы по подписям Interpro:
Описание доменной архитектуры CISY_BACSU в соответствии с банком Pfam
C помощью опции Jump To, позволяющей производить поиск по любому типу ID белка, был произведён поиск по Pfam. Результат поиска: (RESULT) - страница структуры 2С6X, откуда возможны переходы к другим базам данных и другим типам информации в Pfam. Результаты поиска доменов в белке описаны в таблице 1.Таблица 1. Доменная структура белка CISY_BACSU
Cхема из Pfam: |
|||||
Пояснения к схеме: |
|||||
№ | Pfam AC | Pfam ID | Полное название семейства доменов | Положение в последовательности | Клан |
1. | PF00285 | Сitrate_synt | Семейство цитратсинтазы из трёх ферментов: цитратсинтазы (EC 2.3.3.1), 2-метилцитратсинтазы (EC 2.3.3.5) и АТФ-цитратлиазы (EC 2.3.3.8). | 5 - 352 | нет |
Краткая характеристика обнаруженного домена
- Во сколько разных архитектур входит домен? Всего известно 26 доменных архитектур, в состав которых входит изучаемый домен. Информация об этих архитектурах доступна по ссылке: ССЫЛКА
- Для какого числа белков, содержащих домен, известна последовательность? Домен входит в структуру 9392 белков.
- Для какого числа разных белков, содержащих домен, определена пространственная структура? Всего обнаружено 103 примера домена Сitrate_synt в белках с известной 3D-структурой, но так как многие структуры содержат по несколько копий молекулы белка, то всего нашёлся лишь 51 различный белок, содержащий описываемый домен.
- Выравнивание фрагментов последовательностей, содержащих домен, доступно по ссылкам:
(1) в формате HTML ССЫЛКА, (2) как выравнивание в Jalview ССЫЛКА.
Описание распространённости и частоты встречаемости доменов среди различных организмов
Так как в данном разделе требуется доменная архитектура с двумя доменами, то структура нашего белка не подходит. Возьмём белок, также относящийся к описанному семейству, но имеющий в структуре два домена: это цитратсинтаза из Fusarium oxysporum - почвенного сапротрофа и факультативного паразита из Ascomycota.Архитектура цитратсинтазы из F. oxysporum: |
Перейдём непосредственно к основной части работы и проанализируем представленность и частоту встречаемости домена у различных групп живых организмов. Результаты представлены в таблице 2.
Таблица 2. Представленность доменов PF00285 и PF00067 в организмах разных таксонов
Таксон | Кол-во белков с доменом PF00285 | Кол-во белков с доменом PF00067 | |
Eukaryota | Viridiplantae | 51 | 442 |
Fungi | 157 | 337 | |
Metazoa | 133 | 567 | |
Другие Eukaryota | 46 | 68 | |
Archaea | 97 | 25 | |
Bacteria | 4603 | 1532 | |
Viruses | 0 | 0 | |
Всего: | 5087 | 2977 (6 из unclassified prokaryota) |
По данным таблицы 2 можно заключить, что цитратсинтазный домен представлен преимущественно у бактерий, а домен p450 представлен одинаково как среди прокариот, так и среди эукариот. Примечательно, что ни один из доменов не встречен у вирусов, что, вероятно, можно объяснить участием обоих в клеточном метаболизме, не относящемся к матричному синтезу.
Сравнение описания мотивов в разных банках семейств (по данным InterPro)
InterPro (integrated resource of protein families, domains and functional sites) представляет из себя единую интегрированную базу данных, охватывающую собой множество различных баз данных, посвящённых семействам белков: Pfam, Prosite, Prints, Blocks, Smart, Superfamily, ProDom, PIRaln, ProClass, Systers, Picasso etc.Рис. 1 Все подписи (signatures) к последовательности CISY_BACSU, интегрированные в Interpro |
Ответы на некоторые вопросы по подписям Interpro:
- Наиболее короткий описанный мотив CITRATE_SYNTHASE (на рисунке показан чёрным) охватывает остатки с 249 по 261 и соответствует активному сайту фермента. Описан в банке PROSITE patterns (PS00480).
- Наиболее длинный описанный мотив Citrate_synth (белый, третий сверху) охватывает всю последовательность и описывает её как единый домен. Описан в банке PIRSF (PIRSF001369).
- В Interpro интегрированы две структурные подписи для исследуемого белка. Первая Citrate synthase-like, core (IPR016141) охватывает остатки со 2 по 366 (почти всю последовательность) и принципиально не отличается от описанного для Pfam случая. Вторая же включает в себя два участка: Citrate synthase-like, large alpha subdomain (IPR016142) и Citrate synthase-like, small alpha subdomain (IPR016143), которые охватывают фрагменты последовательности 11-228 и 229-316 соответственно. Таким образом доменная структура, показанная во второй подписи, несколько углубляет и расширяет наши знания о доменной архитектуре CISY_BACSU, показывая, что наличествуют два субдомена.
Дата последнего обновления: 27.05.2013
© Dmitry Travin, 2012