Эволюция доменной архитектуры.

Главная

AC: PF08769

ID: Spo0A_C

Функция: С-концевой фактор инициации споруляции.

Различных доменных архитектур две:

1) A0Q0B0_CLONN (391 последовательность)

2) A7B235_RUMGN (101 последовательность)

Распределение по таксонам (492 последовательности у 371 вида):

Bacteroidetes: 4 последовательности

Firmicutes: 487 последовательности, в т.ч. Clostridia: 288, Negativicutes: 1, Bacillales: 170, Erysipelotrichi: 28 последовательностей

bacterium MP1: 1 последовательность

Другой домен архитектуры A0Q0B0_CLONN: Response_reg (PF00072) - домен, связывающий регулятор ответа, имеет 103232 последовательностей у 3470 видов, 2854 различных архитектур.

Выравнивание последовательностей из домена.

Таблица с описанием представителей домена.

Выравнивание выборки последовательностей из двух архитектур.

Построение филогенетического дерева выборки последовательностей домена

В названии:
1 - архитектура A0Q0B0_CLONN,
2 - архитектура A7B235_RUMGN,
B - класс Bacillales,
C - класс Closrtidia,
E - класс Erysipelotrichi,
N - класс Negativicutes.
(Выравнивание с измененными именами последовательностей.)

Филогенетическое дерево, построенное методом Neighbor-joining:

Филогенетическое дерево, построенное методом UPGMA:

Методы Neighbor-joining и UPGMA были выбраны, так как при выполнении заданий на применение различных методов реконструкции филогении я убедилась, что эвристические методы эффективнее воспроизводят таксономическое дерево.

Неукорененное дерево Neighbor-joining было укоренено с точки зрения разделения по доменным архитектурам (так как они образуют клады на дереве). Выбивающаяся ветвь (выделено лиловым), скорее всего, объясняется погрешностями метода.

Судя по дереву UPGMA можно предположить, что двухдоменная архитектура A0Q0B0_CLONN эволюционировала из однодоменной A7B235_RUMGN (выделено синим). При этом исследуемый домен Spo0A_C появился у Фирмикут класса Closrtidia и Erysipelotrichi (выделено зеленым), а Bacillales отделились от них уже с однодоменной архитектурой (выделено красным). В этом дереве лиловая ветвь расположена более правдоподобно.

Профили

Полученные профили для первой группы (двухдоменная архитектура A0Q0B0_CLONN) и для второй группы (однодоменная архитектура A7B235_RUMGN).

График зависимости числа ошибок первого (FN) и второго (FP) рода от порогового значения score для первого профиля:

Пороговое значение: 22.0, при нем число верных находок равно 20, верно пропущенных последовательностей - 18, число ошибок первого рода и второго рода - 0. Данный профиль позволяет отличить первую группу последовательностей от второй при выбранном значении score.

График зависимости числа ошибок первого и второго рода, число верных находок (ТP) и верно пропущенных последовательностей (TN) от порогового значения score для второго профиля:

Данный профиль не позволяет отличить вторую группу последовательностей.

При поиске по swissprot при помощи первого профиля при пороговом значении score = 22.0 было найдено 17 последовательностей, каждая из которых имеет первую доменную архитектуру. Следовательно, этот профиль хорошо позволяет отличить первую группу последовательностей.


©Гущина Ирина