Эволюционные домены. Банки Pfam и InterPro.

Опиcание доменной архитектуры белка TRMB_BACSU в соответствии с банком Pfam.

База данных Protein family(Pfam) содержит информацию о гомологичных белках и об их семействах. При помощи Pfam были описаны эволюционные домены гомологов HUTI_BACSU, результаты доменной структуры HUTI_BACSU представлена в Таблице 1.
Таблица 1.
Cхема из Pfam:
Схема показывает что домен найден целиком.
Pfam AC Pfam ID Название семейства доменов Положение в последовательности белка KAD_BACSU
1. PF13147 Amidohydro_4 Это семейство ферментов входит в суперсемейство метало-зависимых гидролаз Оно включает в себя аденин-диаминазу (EC:3.5.4.2), которая гидролизует аденин из гипоксантина и аммония. Реакция аденин-диамиазы важна для утилизации аденина , а также как источник азота. Семейство домена названо как раз по названию аденин-диаминазы. 66-383

Домен входит в 79 разных архитектур. Всего в Pfame было найдено 10639 последовательности белков, однако пространственная структура не определена ни одного из них. Также был получен вайл с выравниваниями некоторых последовательностей.(см Рис.1)


Рис.1 Выравнивание фрагментов белков. Покрашены по схеме Clustalx, By Conservation = 33.

Встречаемость доменов у разных групп организмов.

Поскольку белок HUTI_BACSU имеет лишь одну доменную структуру, рассматривать его с этой стороны бесполезно. Для изучения был взят белок UVRB_BACSU. Информация по нему представлена на Рисунке 2 и в таблице 2.


Рис.2 Зеленый и красный прямоугольники с зубчатыми краями означают, что найдены только фрагменты доменов. Полупрозрачный зеленый прямоугольник с острыми краями означает мотив.

Таблица 2.
Таксон
Количество белков с доменом PF04851
Количество белков с доменом PF00271
Эукариоты Зеленые растения 0 3526
Грибы 384 9331
Животные 312 10858
Остальные эукариоты 590 3924
Археи 463 1446
Бактерии 16118 53976
Вирусы 473 5210
Сравнение описание мотивов в разных банках семейств, по данным InterPro.

InterPro(integrated resource of protein families, domains and functional sites) - база данных, которая содержит информацию о семействах белков. В эту БД включены записи из рузих баз (PROSITE, PFAM, PRINTS, ProDom, SMART, TIGRFAMs, PIRSF, SUPERFAMILY). На рисунке 3 изображены домены белка UVRB_BACSU из разных баз данных.


Рис.3

Как можно увидеть из Рис.3, наиболее короткий мотив - PF02151(UVR, который находится в бд Pfam. Наиболее длинный - SSF52540 из бд SUPERFAMILY. В бд InterPro для данного белка интегрированы подписи: P-loop containing nucleoside triphosphate hydrolase; Helicase, superfamily 1/2, ATP-binding domain; Helicase/UvrB domain; Helicase, C-terminal; UvrB, YAD/RRR-motif-containing domain; UVR domain. Границы структурных доменов отличаются от границ доменов Pfam, например, домен UVR в Pfam имеет длину с 626 по 659 остаток, в то время как в SUPERFAMILY с 610 по 659.


© Андреева Анна, 2012 (Последнее исправление: 14.02.2014)