Эволюционные домены. БД Pfam, InterPro.

Задание 1.

Доменная структура белка GLBA_BACSU по данным Pfam

Cхема из Pfam:

домен Glyco_hydro_4 найден без С-конца (скорее всего это недостаток обнаруживающего метода)
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов
(по-русски! и желательно с кратким пояснением)
Положение в последовательности белка XXXX_BACSU Клан
1. PF02056 Glyco_hydro_4 Семейство доменов названо по названию фермента 4-гликозилгиролазы. 7–187 Клан NADP_Rossmann (CL0063), содержит 154 семейства.
2. PF11975 Glyco_hydro_4C Семейство доменов названо по названию С-терминального домена фермента 4-гликозилгиролазы. 191–417 Клан LDH_C (CL0341), содержит всего 2 семейства.

Задание 2. Описание домена Glyco_hydro_4C

Задание 3. Описание доменной структуры моего белка.


Представленность домена PF02056 в организмах разных видов

Таксон
Количество белков с доменом PF02056.
Эукариоты Зеленые растения 1
Грибы 1
Животные 0
Остальные эукариоты 0
Археи 17(у 9 видов)
Бактерии 1127(у 601 вида)
Вирусы 0

Представленность домена PF11975 в организмах разных видов

Таксон
Количество белков с доменом PF11975.
Эукариоты Зеленые растения 0
Грибы 1
Животные 0
Остальные эукариоты 0
Археи 17(у 9 видов)
Бактерии 1125(у 597 видов)
Вирусы 0

Как видно из таблиц, почти не встречаются у эукариот и архей. Также примечательно, что количество белков, в которых встречаются данные домены почти одинаково во всех царствах. Это наталкивает на мысль, что чаще всего они встречаются именно в этой архитектуре.

Задание 4.

Представленность изучаемых доменов в белках Bacillus subtilis

PFAM ID Bacillus subtilis
1. PF02056 4 белка
2. PF11975 4 белка

Все четыре белка несут одинаковую архитектуру, состоящую только из двух данных доменов (т.е. в обеих строках таблицы указаны одни и те же 4 белка.), мой белок так же соответствует данной архитектуре.
Картинки указывают,что белок D4G0A8_BACNA,в отличие от остальных, содержит C-конец домена PF02056, но я полагаю отсутствие его у остальных трех недостатком обнаруживающего метода, поэтому отношу все белки к одной архитектуре.

Задание 5.

Домены PF02056(Glyco_hydro_4) и PF11975(Glyco_hydro_4C) встречаются всего в 4 архитектурах, причем чаще всего они "сцеплены" вместе:
AGAL_BACSU
Реже каждый из них может встретиться по одиночке:
A8S871_9FIRM
GLVG_ECOLI
В A4EAF7_9ACTN похоже произошла дупликация части домена PF11975(Glyco_hydro_4C):

А в D2DIQ1_9BACT оба домена с С-конца входят в состав очень сложной архитектуры:

Задание 6.