№ | Pfam AC | Pfam ID | Полное название семейства доменов с кратким пояснением) |
Положение в последовательности белка YXBC_BACSU | Клан |
1. | PF08007 | Cupin_4 | В суперсемейство Cupin в основном входят белки с неизвестными функциями, в состав этого суперсемейства также входит семейство Cupin_4 |
18–326 | Клан Cupin(CL0029) содержит 39 семейств и 49419 представителя включая семейство Cupin_4. Для клана характерно наличие консервативного "barrel" домена |
Мой домен входит в состав 21 доменной архитектуры
Последовательность известна для 1036 белков
Пространственная структура определена для 2 белков
Просмотрев выравнивания в GeneDoc я предпологаю, что можно говорить о гомологичности
белков, т.к. для них встречаются несколько участков с высокой консервативностью, например:
4 - 17;
149 - 168;
206 - 220;
координаты в выравнивании
Т.к. в моем белке присутствовал только 1 домен, я решил взять белок Q1IAY5_PSEE4 из списка возможных архитектур с моим доменом
Таксон
|
Количество белков с доменом PF08007.
|
|
Эукариоты | Зеленые растения | 16 |
Грибы | 0 | |
Животные | 42 | |
Остальные эукариоты | 57 | |
Археи | 0 | |
Бактерии | 552 | |
Вирусы | 2 |
Домен PF08007 больше всего представлен среди бактерий, среди эукариот наиболее распространен среди
животных. При более глубоком рассмотрении филогенетического древа стало понятно, что распространение
этого домена часто связано со степенью изученности группы
Таксон
|
Количество белков с доменом PF02036.
|
|
Эукариоты | Зеленые растения | 13 |
Грибы | 53 | |
Животные | 48 | |
Остальные эукариоты | 14 | |
Археи | 23 | |
Бактерии | 802 | |
Вирусы | 0 |
Домен PF02036 также в основном встречается у бактерий, не представлен у вирусов. У эукариот в основном
представлен в перечисленных крупных группах, т.к. на остальные группы эукариот приходится всего 14 примеров
В моем белке только 1 домен из-за этого я воспользовался белком из прошлого задания
№ | PFAM ID | Bacillus subtilis |
1. | Cupin_4 | 1 |
2. | SCP2 | 1 в одном подвиде |
Мой домен может встречаться, как ближе к C-концу относительно др. доменов (белок Q1IAY5_PSEE4)
так и ближе к N-концу (реже) (белок D2V3K7_NAEGR)
Домен в белке может быть найденым частично(не полностью)
См. две верхние картинки
Может быть найден полностью с одного конца(с обоих концов не было). Белок D0NRY0_PHYIN
Все перечисленные выше перестройки + дуплицирование домена (белок C4KFU9_SULIK)
Самый короткий мотив- JmjC, он описан в БД SMART, тип распознабщего правила Family
Самый длинный мотив- SSF51197, он описан в БД SuperFamilies, тип распознабщего правила Superfamily
Координаты различаются:
В InterPro: 19 - 296;
В Pfam: 18 - 326;