Еще раз про эволюцию белков. Домены. БД Pfam, InterPro.

  1. Исследование доменной структуры белка SYC_ECOLI.
    1. Описание доменной структуры белка по данным Pfam.
    2. Выполним это задание с помощью базы данных Pfam.
      По идентификатору UniProt SYC_ECOLI найдем описание его доменной организации.

      Доменная структура белка SYC_ECOLI по данным Pfam.

      Cхема из Pfam (голубое - low_complexity):
      Пояснения к схеме:
      Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка SYC_Ecoli Клан
      1. PF01406 tRNA-synt_1e tRNA синтетаз класс I (C) каталитический домен.
      Это семейство включает только цистеинил - tRNA синтетазы.
      14-314 аминоацил - tRNA синтетаз I
      Этот клан состоит из 7 семейств и общим числом доменов 23708.
      2. PF09190 DALR domain DALR домен
      Этот домен обнаружен в цистеинил-tRNA-синтетазах.
      341-402 DALR суперсемейство
      Это антикодон-связывающие домены из разных tRNA синтетаз.
      Этот клан состоит 2 семейств и общее число доменов в нем 4178.

    3. Выравнивание-затравка (seed) для N-концевого домена (tRNA-synt_1e) белка SYC_ECOLI в формате msf.
    4. Получили файл(формат txt) и файл (формат msf).

    5. Сравнение описаний доменной структуры в Pfam с описанием в других БД.
    6. Для этого воспользуемся БД InterPro. По идентификатору UniProt найдем описание всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID.

      Cреди них найдем подпись, которая, на наш взгляд, наиболее отличается от подписей PFAM и может породить иное представление о первичной структуре заданного белка.

      Структурные мотивы на данном этапе можно (и даже лучше) опустить.
      

      Была выбрана база данных SPRINT, так изображение мотивов белка наиболее сильно отличалось от полученного в Pfam.
      Ни один из мотивов не совпал. InterPro ID этой записи - IPR015803.

    7. Сопоставление доменной структуры с 3D структурой белка SYC_ECOLI.
    8. Получим изображение 3D-структуры заданного белка, в котором цветом выделены отдельные домены в последовательности.

      Откроим страничку Pfam с доменной структурой белка. Выберем кнопку "Structures" в левом меню.
      В открывшемся списке структур выберем структуру, содержащую, по крайней мере, 2 домена - я выбрала 1li5.
      Выберем кнопку "View structure" и выберем программу Jmol.
      Если не повезло (невозможно разобраться в картинке из-за большого количества одинаковых цепей),
      то щелкните по картинке, в выпавшем меню выберите кнопку "Console" и введите в командное окно команду display *:A.

      Рассмотрим изображение и ответим на следующие вопросы:

      • соответствуют ли домены Pfam отдельным компактным частям структуры (структурным доменам), или нет?
      • если домен Pfam попадает на отдельный структурный домен, то насколько полно такое совпадение?

      Структурные домены выделить не возможно, поэтом если рассмотреть просто части структуры, то складчатые слои и в цепи А, и в В принадлежат к tRNA-synt_1e, но этот домен так же состоит и из спиралей. Домен DALR_2 в обеих цепях представлят 2 альфа-спирали.

  2. Исследование эволюции отдельных доменов.
    1. Описание частоты встречаемости доменов белка SYC_ECOLI в разных организмах.
    2. Откроем страничку Pfam с доменной структурой белка. Выберем страничку с описанием конкретного домена.

      Представленность домена PF01406 в организмах разных видов

      Таксон
      Количество белков с доменом PF01406
      Эукариоты Зеленые растения
      10
      Грибы
      70
      Животные
      101
      Остальные эукариоты
      73
      Бактерии
      1813
      Археи
      75

      Представленность домена PF09190 в организмах разных видов

      Таксон
      Количество белков с доменом PF09190
      Эукариоты Зеленые растения
      1
      Грибы
      1
      Животные
      5
      Остальные эукариоты
      13
      Бактерии
      1355
      Археи
      65

      Можно сделать вывод о том, что оба домена встречаются в большинстве своем в бактериях и архибактериях. Возможно предположение, что выполняемая ими функция имела наибольшее значение в одноклеточных организмах.

    3. Встречаемость найденных доменов в белке SYC_ECOLI в разных белках Escherichia coli K12.
    4. Открывая страничку с таксономическим деревом Pfam для доменов заданного белка, с помощью команды "Ctrl+F" браузера найдитем таксон Escherichia coli (strain K12), поставив перед названием таксона галочку и выбрав по "View graphically" в правом меню.

      Представленность изучаемых доменов в белках Escherichia coli (strain K12).

      PFAM ID Количество белков в Escherichia coli (strain K12)
      1. PF01406
      1
      2 PF09190
      1

      В Escherichia coli (strain K12) обнаружен только один белок с такой доменной организацией. Можно предположить, что белок выполняет специфическую функцию, поэтому такой набор доменов для него специфичен.

    5. Примеров разных доменных перестроек.
    6. Для каждого из доменов заданного белка рассмотрим варианты доменной организации и подберем наиболее яркие примеры доменных перестроек.

      PF01406 (tRNA-synt_1e).

      Встречается в сочетаниях с разными доменами, обычно занимает либо N-концевое положение, либо в середине последовательности белка, реже в конце. Иногда домен разрывается другим доменом.

      PF09190 (DALR_2).

      Встречается в основном в сочетании с первым доменом. Обычно занимает С-концевое положение. Чаще всего в последовательности встречается начальная половина последовательности домена.



©Пискунова Юлия 2010