Гомология и множественное выравнивание

Гомология и множественное выравнивание

Выбор ID из базы Pfam

Из таблицы для проведения анализа было выбрано следующее семество доменов из Pfam: DmpG-like communication domain

Характеристика:

  • AC:PF07836
  • ID:DmpG_comm
  • Name:DmpG-like communication domain
  • Seed:55
  • Full:1696
  • 3D-structure:9
  • Architectures:5
  • Описание выравнивания seed

    Таблица 1

    Что ищем Информация Комментарии
    seed число последовательностей - 50, число колонок - 63 Информация отличается от представленной в таблице 2023 года
    МДБ-all 11-15, (11-19?, 14-19?), (47)49-54*, При консервативности 100% окрашиваются участки 14-15(*), (47)49-51. Однако в 7 пос-ти есть цистеин в 15 колонке. Хоть цистеин и нейтральная ак, но полярная, в отличие от других, тем не менее при установки порога консервативности 100% все окрашено одним цветом. В дальнейшем буду помечать похожие случаи '*'. Но это не МДБ, так как они короткие. При понижении процента до 35% можно попробовать выделить более длинные. Ecли рассматривать блок 11-15, то все подходит под критерии, указанные в задании, так как начало и конец абсолютно консервативны. Однако если смотреть на окрашивание, то блок с одной стороны уж очень хочется расширить, тогда концом станет 19 позиция, но там есть тирозин (это хоть нейтральная полярная ак, как и цистеин, но содержит OH-группу), с другой 11 колонку очень хочется внести во 2 пункт. Для второго если начало рассматриваем с 47 позиции, то функциональная консервативность есть, ссылаясь на то что тирозин неполярен, однако за начало лучше принимать 49 позицию так как она абсолютно консервативна и если сдвинуться на шаг влево достоверность изменится, так как 48 позиция не абсолютно и не функционально (есть кислая ак) консервативна. Конец окрашен даже при 100%, функционально консервативен.
    МДБ-all(columns) 11:G, 58:AVIC(*), 8:LVIM, 32:VLI, 37:VLIМ, 41:CAVL(*), 54:LIC(*), 61:LIM. Выбирала те, которые были полностью окрашены первые две при conservtion 100%. 11 хоть я включила в блок первого пункта, но она уж очень просится быть колонкой. 58 функционально консервативна. остальные стали заметны при понижении до 35%. хочу обратить внимание на 38 колонку, там есть тирозин, его не включила на основе рассуждений в предыдущих пунктах
    МДБ-notAll 11-21:1-24(+25), 11-21:26-45 При формировании групп я хотела расширить МДБ-all до длины(10) и на выходе получить несколько групп, которые содеражат более трех последовательностей. После сортировки по группам расформировала последовательности таким образом, чтобы справа и слева от блоков не было сходных. В первом при добавлении 25 строки консервативность станет функциональной(справа). Можно увидеть в группах еще много консервативных участков.
    МДБ-notAll(columns) 7:TS, 23:AIV, 38:IL, 42:G, 56:DE в 23 есть треонин, содеражший OH-группу, аналогично тирозину.
    нет ДБ 24-31 выставлен порог 35%(информация из лекции). я включила лишь этот блок, так как он достаточно длинный, что позволяет избежать сходства даже для двух последовательностей. в других же неокрашенных участках подобное совпадение встретить можно
    (Jalview project).