Эволюция доменов

Выбранный домен - TOBE-like domain. (AC = PF12857, ID = TOBE_3) Вероятно, участвует в узнавании маленьких лигандов, например молибдена или сульфатов. Выбран, так как домены, имевшиеся у ABC-транспортерного периплазматического связывающего аминокислоты белка, не подходили под заданные критерии. Всего 2 архитектуры найденны для этого домена. В одной присутствует только сам домен (цифра 2 в маркировке), в другой перед ним стоит домен с AC PF00005 (цифра 1 в маркировке).

В качестве таксона были выбраны Proteobacteria, а подтаксонами стали Gammaproteobacteria (буква G в маркировке доменов) и Betaproteobacteria (буква B в маркировке доменов).

Выравнивание всех доменов показано в проекте Jalview и доступно по ссылке.

Таблица excel с указанием наличия доменов, таксономии и выборкой белков для работы доступна по ссылке.

Выравнивание доменов, выбранных для работы, показано в проекте Jalview и доступно по ссылке.

Дерево, построенное методом Neighbor-Joining using % identity cо 100 репликами Bootstrap показано на рис.1. Как видно из рисунка, не для всех доменов филогения была правильно определена. G3Z6R9 и D2ZYC2 принадлежат бетапротеобактериям, но расположеены на ветка с гаммапротеобактериями. A0KFW5 принадлежит гаммапротеобактериям, но занесен к бетапротеобактериям. Вероятные события в эволюции домена следующие: Предполагается, что начальная структура состояла из нескольких доменов (ближе к архитектуре 1).Затем выделились группы бета- и гамма-протеобактерий. Затем появилась архитектура типа 2 у части гамма-протеобактерий - второй домен двухдоменной архитектуры был удален. Это объясняет, почему большинство носителей второй архитектуры - гаммапротеобактерии. Поскольку архитектура второго типа есть и у бетапротеобактерий, вероятно ее появление - независимое событие.


Рис.1. Дерево

Был построен профиль для подтаксона бетапротеобактерий с архитектурой 1 типа. Профиль был откалиброван и применен к fasta-файлу со всеми найденными доменами TОВЕ-like. Результат в файле по ссылке. На его основе была построенаа ROC-кривая, показанная на рис.2.


Рис.2. ROC-кривая

По кривой был выбран порог e-value в 8.1e-17, при таком пороге получаются следующие результаты применения профиля:

Таблица 1. Результаты применения профиля
на самом деле принадлежит не принадлежит сумма
выше порога 13 69 82
ниже порога 1 263 264
сумма 14 332 346

Судя по сумме ROC-кривой и высоком количестве правильных находок при маленьком e-value, профиль можно использовать для поиска подсемействаю

© Маслова Валентина, 2014
Последнее изменение: 24.09.2014