Четвертый семестр

Интересно и полезно

Главная

Семестры

Ссылки

О себе

Восстановление предкового состояния доменной архитектуры

Цель работы

* Реконструировать эволюцию доменной архитектуры выбранного домена

Выбор семейства доменов

Для анализа был выбран домен PF00544 семейство белков - Pec_lyase_C .

Для этого белка по данным Рfam найдено 3043 последовательностей домена, относящиеся к 805 видам. Существует всего 62 архетиктур этого белка.

Пектат-лиаза (ЕС 4.2.2.2) является ферментом, принимающим участие в гниения растительной ткани. Пектата лиазы катализирует расщепление пектата до олигосахаридов.

Cписок разных доменных архитектур с этим доменом

Были выбраны две архитектуры, включающие этот домен:

  • 1 - Pec_lyase_C, CBM_1 (34 последовательности)
  • 2 - Pec_lyase_N, Pec_lyase_C (159 последовательносей)
  • Далее было скаченно полное выравнивание всех последовательностей домена с сайта PFAM. Проект в Jalview Следующим нашим шагом была получена таблица, содержащая информацию о доменной структуре каждой последовательности и ее таксономии. Данные были получины с помощью предоставленных скриптов. Результат

    Дерево

    В данной части введены другие обозначения относительно первой часть!!!

    Были выбраны последовательности из двух архитектур Выборка, переобозначена. Обозначения: Белки были взяты двух доменные(обозначение "2_"). Таксоны были обозначены таким образом

  • E - Eudicotyledons (Eukaryota)(обозначено синим цветом)
  • L - Liliopsida (Eukaryota)(обозначено синим цветом)
  • Даные две группы входят в одну архитектуру 2 - Pec_lyase_N, Pec_lyase_C

  • B - Bacteria.(обозначено красным цветом)
  • Данная группа входит в одну архитектуру 1 - Pec_lyase_C, CBM_1

    После чего было получено выравнивание, разделенное на две группы, по архитектурам. Данное выравнивание уже обрезано для построение дерева

    Далее на основе этого выравнивания было получено деверо с помощью программы Mega(был использован метод Test Maxcium Liklihood).

    Рис1. Изображение дерева. Программа Mega. Красным обозначен домен 1 - Pec_lyase_C, CBM_1; Синим - 2 - Pec_lyase_N, Pec_lyase_C

    Скобочная форма

    ((((((((((((((2_E_I1J5K9_SOYBN,2_E_I1JBP5_SOYBN),(2_E_G7K9T2_MEDTR,2_E_G7K9T3_MEDTR)),2_E_D7KBK0_ARALL),(2_E_PLY19_ARATH,2_E_Q08A70_ARATH)),2_E_B9HJT8_POPTR),2_L_A1KXJ5_ELAGV),(2_E_G7JPX7_MEDTR,(2_E_C6TK37_SOYBN,2_E_Q40319_MEDSA))),2_L_PLY_LILLO),(((2_L_B6TSP4_MAIZE,2_L_F2EHZ3_HORVD),2_L_B8B435_ORYSI),(2_L_I1HYQ7_BRADI,(2_L_A2X2E3_ORYSI,2_L_C5XY12_SORBI)))),(2_L_Q43862_MAIZE,(2_L_A2Y966_ORYSI,2_L_Q0DEM8_ORYSJ))),2_L_C5Z3W2_SORBI),2_L_I1PZH5_ORYGL),(2_B_G7G841_9GAMM,2_B_F3BIN1_PSEHA)),((((2_B_H6NIV6_9BACL,2_B_F8FKP1_PAEMK),2_B_I0BVD7_9BACL),2_B_C6WE48_ACTMD),(((2_B_A1R1E6_ARTAT,2_B_B8HAN4_ARTCA),2_B_A1R1E5_ARTAT),(((2_B_C9YYE3_STRSW,2_B_D7CI53_STRBB),2_B_D9X0K9_STRVR),(2_B_C6WQV0_ACTMD:,(2_B_D9WXU0_STRVR,(2_B_B5HFS8_STRPR,2_B_F2R4J6_STRVP)))))))

    Дерево отчетливо делится на 2 множества - красным выделено множество прокариот, синим - второе множество, состоящее из эукариот. Если рассматривать множество эукариот, то на дереве не видно четкого разделения между группами Eudicotyledons, Liliopsida .

    Часть 3: профиль

    Было выбрано подсемейство Bacteria (так как выделялась хорошая клада). Для построения профиля использовался пакет HMMER. С помощью программы hmm2build, hmm2calibrate был построен профиль. По этому профилю был проведен поиск по всем белкам, включающим домен PF00544 с помощью программы hmm2search. Результат

    После построили Roc-кривую и таблицу (см. ниже).

    Рис.2. ROC-кривая для выбранного подсемейства. Вычисления(лист Line)

    Таблица 1. Данные по профилю для E-value 1.1e-109

    Принадлежит семействуНе принадлежит семействуСумма
    Выше порога14428
    Ниже порога9932941
    Сумма 23936