Эволюция белков. Домены. БД Pfam, InterPro.


  1. Исследование доменной структуры конкретного белка
    1. Описать доменную структуру белка по данным Pfam
    2. Доменная структура белка RECQ_ECOLI по данным Pfam

      Cхема из Pfam:
      Пояснения к схеме
      Pfam AC Pfam ID Полное название семейства домена
      Положение в последовательности белка RECQ_ECOLI Клан
      1. PF00218 IGPS DEAD/DEAH участок связывания хеликазы 27-192 Клан AAA (CL0023),
      содержит 142 сем-ва,
      у 11-ти неизвестна функция
      (PFAM ID начинается с DUF)
      2.  PF00271 Helicase_C Консервативный С-концевой домен геликазы 254-331 Клан AAA (CL0023),
      содержит 142 сем-ва,
      у 11-ти неизвестна функция
      (PFAM ID начинается с DUF)
      3.  PF09382 RQC RQC домен 411-514 Клан HTH (CL0123),
      содержит 141 сем-во,
      у 19-ти неизвестна функция
      (PFAM ID начинается с DUF)
      4.  PF00570 HRDC HRDC домен 532-599 Клан HRDC-like (CL0426),
      содержит 3 сем-ва


      Выравнивание-затравка (seed) для N-концевого домена белка RECQ_ECOLI:  PF00270_seed.msf

    3. Сравнение описания доменной структуры в Pfam с описанием в других БД.



    4. На мой взгляд, наиболее отличается от подписей Pfam подпись PROSITE profile, на рисунке отмечена оранжевым цветом.
      Её InterPro ID: IPR001650
      Эта запись описывает хеликазную активность, а также связывание нуклеиновых кислот.

      Такой участок представлен во всех интегрированных подписях из других баз данных(указано 18) и несет не очень много информации о первичной структуре заданного белка.

    5. Сопоставление доменной структуры с 3D структурой заданного белка


    6. Зеленым цветом обозначен домен (белка DD19B_HUMAN, длина: 116-284) DEAD (PF00270), красным цветом - Helicase_C (PF00271) (длина:351-434), оранжевым - HRDC, а серым - RCQ.
      Домены соответствуют вполне отдельным компактным частям структуры.
      В принципе, домены Pfam попадают на отдельные структурные участки, причем, практически с отличным совпадением; наблюдаются небольшие разногласия на краях структурных доменов.

  2. Исследование эволюции отдельных доменов
    1. Необходимо описать, как часто и в каких организмах встречаются домены белка RECQ_ECOLI
    2. Домен RQC (PF09382) встретился в рганизмах 603 видов.
      Домен DEAD (PF00270) - 1415, Helicase_C (PF00271) - 1720, HRDC (PF00570) - 698.


      Представленность домена PF09382 в организмах разных видов

      Таксон
      Количество белков с доменом PF09382
      Эукариоты Зеленые растения  32
      Грибы  66
      Животные  88
      Остальные эукариоты  5
      Бактерии  998
      Археи  10

    3. Определить в скольких разных белках Escherichia coli K12 встречаются домены, представленные в RECQ_ECOLI.


    4. Представленность изучаемых доменов в белках Escherichia coli (strain K12)

      PFAM ID Количество белков в Escherichia coli (strain K12)
      1.  PF00270  15
      2.  PF00271  17
      3.  PF09382  1
      4.  PF00570  2


      Чаще всего встречается консервативный С-концевой домен геликазы, а реже всего - RQC домен.

    5. Приведем несколько примеров разных доменных перестроек
    6. Домен PF00270:

      Наблюдаем сочетание домена DbpA с различными доменами белка:

      DBPA_ECOLI:
      DEAD_ECOLI:

      Разные домены рядом с доменом HA2:

      HRPA_ECOLI:
      HRPB_ECOLI:

      Разрыв в последовательности домена:

      YFJK_ECOLI:

      Домен PF00271:

      Различное расположение домена ResШ по отношению к домену Helicase_C.

      T1RK_ECOLI:
      UVRB_ECOLI:

      RQC домен встречается только в RECQ_ECOLI.

      PF00570 домен имеет единственную доменную перестройку:

      RND_ECOLI:

      На страничку с результатами 4 семестра.
      На главную страничку.