БД Pfam и InterPro


1) Доменная структура белка YXBC_BACSU по данным Pfam

Pfam AC Pfam ID Полное название семейства доменов
с кратким пояснением)
Положение в последовательности белка YXBC_BACSU Клан
1. PF08007 Cupin_4 В суперсемейство Cupin в основном входят
белки с неизвестными функциями, в состав
этого суперсемейства также входит семейство Cupin_4
18–326 Клан Cupin(CL0029) содержит 39 семейств
и 49419 представителя включая семейство Cupin_4. Для клана характерно
наличие консервативного "barrel" домена

2) Описание домена Cupin_4

Мой домен входит в состав 21 доменной архитектуры
Последовательность известна для 1036 белков
Пространственная структура определена для 2 белков
Просмотрев выравнивания в GeneDoc я предпологаю, что можно говорить о гомологичности
белков, т.к. для них встречаются несколько участков с высокой консервативностью, например:
4 - 17;
149 - 168;
206 - 220;
координаты в выравнивании

3) Присутствие доменов в разных таксонах

Т.к. в моем белке присутствовал только 1 домен, я решил взять белок Q1IAY5_PSEE4 из списка возможных архитектур с моим доменом

Представленность домена PF08007 в организмах разных видов

Таксон
Количество белков с доменом PF08007.
Эукариоты Зеленые растения 16
Грибы 0
Животные 42
Остальные эукариоты 57
Археи 0
Бактерии 552
Вирусы 2

Домен PF08007 больше всего представлен среди бактерий, среди эукариот наиболее распространен среди
животных. При более глубоком рассмотрении филогенетического древа стало понятно, что распространение
этого домена часто связано со степенью изученности группы

Представленность домена SCP2 (PF02036) в организмах разных видов

Таксон
Количество белков с доменом PF02036.
Эукариоты Зеленые растения 13
Грибы 53
Животные 48
Остальные эукариоты 14
Археи 23
Бактерии 802
Вирусы 0

Домен PF02036 также в основном встречается у бактерий, не представлен у вирусов. У эукариот в основном
представлен в перечисленных крупных группах, т.к. на остальные группы эукариот приходится всего 14 примеров

4) Присутствие данных доменов у Bacillus subtilis

В моем белке только 1 домен из-за этого я воспользовался белком из прошлого задания

Представленность изучаемых доменов в белках Bacillus subtilis

PFAM ID Bacillus subtilis
1. Cupin_4 1
2. SCP2 1 в одном
подвиде

5) Доменные перестройки


Перестройки домена Cupin_4

Мой домен может встречаться, как ближе к C-концу относительно др. доменов (белок Q1IAY5_PSEE4)


так и ближе к N-концу (реже) (белок D2V3K7_NAEGR)



Домен в белке может быть найденым частично(не полностью)
См. две верхние картинки

Может быть найден полностью с одного конца(с обоих концов не было). Белок D0NRY0_PHYIN



Также я решил описать перестройки домена SCP2, т.к. было мало своих

Все перечисленные выше перестройки + дуплицирование домена (белок C4KFU9_SULIK)


6*) Сравните описание мотивов в разных БД

Самый короткий мотив- JmjC, он описан в БД SMART, тип распознабщего правила Family
Самый длинный мотив- SSF51197, он описан в БД SuperFamilies, тип распознабщего правила Superfamily
Координаты различаются:
В InterPro: 19 - 296;
В Pfam: 18 - 326;

Главная страница (см. ниже)
©Abdullaev Eldar