Эволюция доменов |
||||||||||||||||||||||||||||
|
Выбранный домен - TOBE-like domain. (AC = PF12857, ID = TOBE_3) Вероятно, участвует в узнавании маленьких лигандов, например молибдена или сульфатов. Выбран, так как домены, имевшиеся у ABC-транспортерного периплазматического связывающего аминокислоты белка, не подходили под заданные критерии. Всего 2 архитектуры найденны для этого домена. В одной присутствует только сам домен (цифра 2 в маркировке), в другой перед ним стоит домен с AC PF00005 (цифра 1 в маркировке). В качестве таксона были выбраны Proteobacteria, а подтаксонами стали Gammaproteobacteria (буква G в маркировке доменов) и Betaproteobacteria (буква B в маркировке доменов). Выравнивание всех доменов показано в проекте Jalview и доступно по ссылке. Таблица excel с указанием наличия доменов, таксономии и выборкой белков для работы доступна по ссылке. Выравнивание доменов, выбранных для работы, показано в проекте Jalview и доступно по ссылке. Дерево, построенное методом Neighbor-Joining using % identity cо 100 репликами Bootstrap показано на рис.1. Как видно из рисунка, не для всех доменов филогения была правильно определена. G3Z6R9 и D2ZYC2 принадлежат бетапротеобактериям, но расположеены на ветка с гаммапротеобактериями. A0KFW5 принадлежит гаммапротеобактериям, но занесен к бетапротеобактериям. Вероятные события в эволюции домена следующие: Предполагается, что начальная структура состояла из нескольких доменов (ближе к архитектуре 1).Затем выделились группы бета- и гамма-протеобактерий. Затем появилась архитектура типа 2 у части гамма-протеобактерий - второй домен двухдоменной архитектуры был удален. Это объясняет, почему большинство носителей второй архитектуры - гаммапротеобактерии. Поскольку архитектура второго типа есть и у бетапротеобактерий, вероятно ее появление - независимое событие. Рис.1. Дерево Был построен профиль для подтаксона бетапротеобактерий с архитектурой 1 типа. Профиль был откалиброван и применен к fasta-файлу со всеми найденными доменами TОВЕ-like. Результат в файле по ссылке. На его основе была построенаа ROC-кривая, показанная на рис.2. Рис.2. ROC-кривая По кривой был выбран порог e-value в 8.1e-17, при таком пороге получаются следующие результаты применения профиля:
Таблица 1. Результаты применения профиля
Судя по сумме ROC-кривой и высоком количестве правильных находок при маленьком e-value, профиль можно использовать для поиска подсемействаю |
|||||||||||||||||||||||||||
© Маслова Валентина, 2014 Последнее изменение: 24.09.2014 |