Эволюционные домены. Банки Pfam и InterPro

Опиcание доменной архитектуры белка YOAJ_BACSU в соответствии с банком Pfam.

С помощью банка Pfam была получена схема доменной архитектуры белка YOAJ_BACSU. Она показана на рисунке 1. Пояснения к схеме представлены в таблице 1.


Рис.1. Схема доменной архитектуры белка YOAJ_BACSU. Зеленым цветом показан домен DPBB_1.

Таблица 1. Пояснения к схеме доменой архитектуры белка YOAJ_BACSU.

Pfam AC Pfam ID Полнное название семейства доменов Положение в последовательности белка Клан
1 PF03330 DPBB_1 Дубль-psi beta-бочонок, характерный для белков Rare lipoprotein A. У разных белков может выполнять разные функции, может выступать в роли ферментативного домена. 56 - 127  Клан DPBB (CL0199) содержит 5 достаточно разнообразных семейств доменов, выполняющих в основном каталитические функции.

Кроме домена DPBB_1 белок YOAJ_BACSU содержит сигнальный пептид (sig_p, на схеме оранжевый) в положении 1 - 25 и участок низкой сложности в положении 33 - 46 (low_complexity, на схеме голубой).

Информация о домене DPBB_1

Домен DPBB_1 входит в 43 различные архитектуры. Известна последовательность 5162 белков и определена пространственная структура трех различных белков, содержащих данный домен.
Для фрагментов белков, соответствующих домену DPBB_1, было получено множественное выравнивание в формате msf. Файл с выравниванием можно получить пройдя по ссылке. На рисунке 2 представлено изображение выравнивания.

Рис.2. Множественное выравнивание фрагментов белков, соответствующих домену DPBB_1.

На изображении выравнивания видно, что некоторые консервативные участки сохраняются по всей его длине. Исходя из этого, можно сделать вывод, что выравнивание достаточно достоверно.

Анализ встречаемости доменов PF00759 и PF03330 в организмах разных таксонов

Для анализа встречаемости доменов в организмах взята архитектура E4XG49_OIKDI, содержащая домены PF00759 (Glyco_hydro_9) и PF03330 (DPBB_1). Её изображение показано на рисунке 3. Домен PF00759 (Glyco_hydro_9) характерен для семейства гликозил-гидролаз 9. Это широко распространенная группа ферментов, гидролизующих гликозидные связи в молекулах углеводов. Для обоих доменов были получены таксономические деревья с указанием числа доменов для каждого таксона. Результаты анализа представлены в таблице 2.


Рис.3. Схема архитектуры E4XG49_OIKDI. Красным цветом показан домен PF03330, а зеленым PF00759.

Таблица 2. Представленность доменов PF00759 и PF03330 в организмах разных таксонов.

Таксон Количество белков с доменом PF00759 Количество белков с доменом PF03330
Эукариоты Зеленые растения 697 1623
Грибы 28 317
Животные 229 127
Остальные эукариоты 35 75
Археи   3 0
Бактерии   836 3011
Вирусы   0 3

В результате анализа выяснилось, что оба домена наиболее широко представлены среди зеленых растений и бактерий. Такое распределение встречаемости доменов согласуется с их функциями, так как для мноих белков, содержащих эти домены, характерна эндоглюканазная активность, а способностью расщеплять полисахариды в основном обладают растения и бактерии.

Сравние описания мотивов в разных банках семейств, по данным InterPro для белка YOAJ_BACSU

InterPro - это база данных, в которой хранится информация о различных семействах белков, доменах, сайтах и мотивах. Она объеиняет различные базы данных, такие как SUPERFAMILY, CATH-Gene3D, PRINTS, PANTHER, Pfam. В результате выполнения работы было получено изображение со сравнением особенностей последовательности YOAJ_BACSU, из баз данных SUPERFAMILY, CATH-Gene3D и Pfam. Его можно увидеть на рисунке 4.


Рис.4. Изображение доменов последовательности YOAJ_BACSU из различных баз данных. Домены SUPERFAMILY показаны коричневым, Gene3D - розовым, Pfam - синим.

Самый короткий мотив называется PF03330 (DPBB_1), он описан в банке Pfam. SSF50685 (Barwin_like) - самый длинный мотив он описан в банке SUPERFAMILY. Оба они относятся к группе доменов Barwin-related endoglucanase (IPR009009). В InterPro приведены две структурные подписи для белка YOAJ_BACSU. Одна из них из банка PDB с достаточной достоверностью описывает его структруру, её положение 26 - 232. Другая из банка MODBASE имеет предположительный харатер, она начинается с 17 и заканчивается 211 аминокислотным остатком. Эти подписи не интегрированы в InterPro (для них не указан InterPro ID). Домен, описанный в Pfam, имеет положение 56 - 127, он находится в гранцах описанных выше структурных подписей.


© Анисимова Александра, 2013