vkВконтакте
kodomoallakarpova@kodomo.fbb.msu.ru
GMailvseokeyboss@gmail.com
Учебный сайт
   Карповой Аллы
Банк семейств белковых доменов Pfam


Pfam - большая коллекция семейств эволюционных доменов (консервативных фрагментов последовательности белка). В моей работе были проанализированы домены белка ybbD_BACSU.

Доменная архитектура белка ybbD_BACSU

Схема из Pfam
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов Положение в последова- тельности белка ybbD_bacsu Клан
1 PF00933 Glyco_hydro_3 N-концевой домен 3-его семейства гликозил-гидролаз. Белки этого семейства осуществляют гидролиз гликозидных связей между 2 и более углеводородами, или между углеводородом и не углеводородной частью. 43-392 CL0058 - содержит 50 семейств гликозил-гидролаз (114169 доменов) , имеющих структуру ТIM-бочки(название от триозофосфатизомеразы)
2 PF01915 Glyco_hydro_3_C С-концевой домен 3-его семейства гликозил-гидролаз. 435-638 CL0058

Табл.1.

Данные о домене Glyco_hydro_3

  • Входит в 142 разные архитектуры;
  • Для 9251 белка, содержащих домен, известна последовательность;
  • Для 8 разных белков, содержащих домен, определена пространственная структура;
  • Файл с выравниванием фрагментов белков, содержащих домен, можно посмотреть здесь.

Частота встречаемости доменов в разных организмах по отдельности

Белок ybbD_BACSU содержит два домена (Glyco_hydro_3 и Glyco_hydro_3_C), поэтому он подходит для анализа. Напомним его архитектуру : . Проанализируем встречаемость доменов Glyco_hydro_3 и Glyco_hydro_3_C у разных таксонов организмов. (Табл.2)

Таксоны Количество белков с доменом PF00933 Количество белков с доменом PF01915
Эукариоты Зеленые растения 375 411
Грибы 1196 1044
Животные 20 15
Остальные 137 126
Археи 63 57
Бактерии 7253 4205
Вирусы 0 0

Табл.2. Встречаемость доменов у разных групп организмов.

На основе проделанной работы можно сделать вывод, что N-концевой домен встречается в целом чаще в белковых последовательностях. Оба домена довольно часто встречаются у эукариот, причем в основном в грибах. N-концевой домен встречается у бактерий почти в 2 раза чаще, чем С-концевой. Оба домена полностью отсутствуют у вирусов.

Сравнение описание мотивов в разных банках семейств, по данным InterPro.

Рис.1. Домены и сайты белка ybbD_BACSU, описанные в InterPro.

  • Самый короткий мотив PS00775 (18 аминокислот активного центра - GLYCOSYL_HYDROL_F3) описан в банке PROSITE.
  • Самый длинный мотив (весь белок без сигнальной последовательности - PTHR30480) описан в банке Panther.
  • В InterPro интегрировано 3 разные структурные подписи. Первая относится к домену Glyco_hydro_cat характерного для суперсемейства гликозил-гидролаз, по всей видимости, это исходный полный N-концевой домен. Он находится на отрезке аминокилот 14-434. Вторая подпись относится к N-концевому домену (Glyco_hydro_3). Согласно банку Pfam он занимает положение 44 - 391, а банку GENE3D - 49 - 408. Третья подпись относится к С-концевому домену (Glyco_hydro_3_C). По банку Pfam он располагается в пределах 436 - 637 аминокислот, а банку GENE3D - 421 - 634.
  • Не очень ясно, почему, ссылаясь на тот же Pfam, InterPro дает пределы доменов сдвинутые на 1 аминокислоту. В банке GENE3D вообще границы доменов расширены и сами они сдвинуты друг к другу поближе. Может, это представляется возможным, потому что несколько концевых аминокислот домена вариабельны и их наличие не столь важно.

© Алла Карпова

Дата последнего редактирования: 08.05.2013

Valid HTML 4.01 Transitional Правильный CSS!