Pfam - большая коллекция семейств эволюционных доменов (консервативных фрагментов последовательности белка). В моей работе были проанализированы домены белка ybbD_BACSU.
Доменная архитектура белка ybbD_BACSU
Схема из Pfam ![]() |
|||||
Пояснения к схеме | |||||
№ | Pfam AC | Pfam ID | Полное название семейства доменов | Положение в последова- тельности белка ybbD_bacsu | Клан |
1 | PF00933 | Glyco_hydro_3 | N-концевой домен 3-его семейства гликозил-гидролаз. Белки этого семейства осуществляют гидролиз гликозидных связей между 2 и более углеводородами, или между углеводородом и не углеводородной частью. | 43-392 | CL0058 - содержит 50 семейств гликозил-гидролаз (114169 доменов) , имеющих структуру ТIM-бочки(название от триозофосфатизомеразы) |
2 | PF01915 | Glyco_hydro_3_C | С-концевой домен 3-его семейства гликозил-гидролаз. | 435-638 | CL0058 |
Табл.1.
Данные о домене Glyco_hydro_3
- Входит в 142 разные архитектуры;
- Для 9251 белка, содержащих домен, известна последовательность;
- Для 8 разных белков, содержащих домен, определена пространственная структура;
- Файл с выравниванием фрагментов белков, содержащих домен, можно посмотреть здесь.
Частота встречаемости доменов в разных организмах по отдельности
Белок ybbD_BACSU содержит два домена (Glyco_hydro_3 и Glyco_hydro_3_C), поэтому
он подходит для анализа. Напомним его архитектуру : .
Проанализируем встречаемость доменов Glyco_hydro_3 и Glyco_hydro_3_C у разных таксонов организмов. (Табл.2)
Таксоны | Количество белков с доменом PF00933 | Количество белков с доменом PF01915 | |
Эукариоты | Зеленые растения | 375 | 411 |
Грибы | 1196 | 1044 | |
Животные | 20 | 15 | |
Остальные | 137 | 126 | |
Археи | 63 | 57 | |
Бактерии | 7253 | 4205 | |
Вирусы | 0 | 0 |
Табл.2. Встречаемость доменов у разных групп организмов.
На основе проделанной работы можно сделать вывод, что N-концевой домен встречается в целом чаще в белковых последовательностях. Оба домена довольно часто встречаются у эукариот, причем в основном в грибах. N-концевой домен встречается у бактерий почти в 2 раза чаще, чем С-концевой. Оба домена полностью отсутствуют у вирусов.
Сравнение описание мотивов в разных банках семейств, по данным InterPro.
![](../im/signature.png)
Рис.1. Домены и сайты белка ybbD_BACSU, описанные в InterPro.
- Самый короткий мотив PS00775 (18 аминокислот активного центра - GLYCOSYL_HYDROL_F3) описан в банке PROSITE.
- Самый длинный мотив (весь белок без сигнальной последовательности - PTHR30480) описан в банке Panther.
- В InterPro интегрировано 3 разные структурные подписи. Первая относится к домену Glyco_hydro_cat характерного для суперсемейства гликозил-гидролаз, по всей видимости, это исходный полный N-концевой домен. Он находится на отрезке аминокилот 14-434. Вторая подпись относится к N-концевому домену (Glyco_hydro_3). Согласно банку Pfam он занимает положение 44 - 391, а банку GENE3D - 49 - 408. Третья подпись относится к С-концевому домену (Glyco_hydro_3_C). По банку Pfam он располагается в пределах 436 - 637 аминокислот, а банку GENE3D - 421 - 634.
- Не очень ясно, почему, ссылаясь на тот же Pfam, InterPro дает пределы доменов сдвинутые на 1 аминокислоту. В банке GENE3D вообще границы доменов расширены и сами они сдвинуты друг к другу поближе. Может, это представляется возможным, потому что несколько концевых аминокислот домена вариабельны и их наличие не столь важно.