Реконструкция филогении по последовательностям гомологичных белков.

Поиск гомологов с помощью локального BlastP

Для выполнения задания была создана локальная база протеомов, выбранных бактерий (таблица 1). С данной базой данных можно ознакомиться по ссылке . Далее с помощью программы blastp были найдены гомологи АТФ-связывающей субъединицы ClpX АТФ-зависимой протеазы Clp бактерии E.coli:

Blast hit Bit-score E-value
sp|Q820F8|CLPX_STRAW ATP-dependent Clp protease ATP-binding sub... 535 0.0
sp|A1SME0|CLPX_NOCSJ ATP-dependent Clp protease ATP-binding sub... 528 0.0
sp|P9WPB9|CLPX_MYCTU ATP-dependent Clp protease ATP-binding sub... 519 0.0
sp|Q6NFU7|CLPX_CORDI ATP-dependent Clp protease ATP-binding sub... 518 0.0
tr|Q47MU4|Q47MU4_THEFY ATP-dependent Clp protease ATP-binding s... 516 0.0
sp|B0RAS4|CLPX_CLAMS ATP-dependent Clp protease ATP-binding sub... 491 1e-173
sp|Q8G5R1|CLPX_BIFLO ATP-dependent Clp protease ATP-binding sub... 432 9e-150
tr|Q8G871|Q8G871_BIFLO Protease OS=Bifidobacterium longum (stra... 51.2 7e-07
tr|Q6NFB1|Q6NFB1_CORDI ATP-dependent Clp protease ATP-binding s... 45.8 3e-05
tr|Q47MZ2|Q47MZ2_THEFY ATPase OS=Thermobifida fusca (strain YX)... 43.9 1e-04
sp|Q8G6B7|RUVB_BIFLO Holliday junction ATP-dependent DNA helica... 42.7 2e-04
tr|Q8G3S2|Q8G3S2_BIFLO ATP-dependent zinc metalloprotease FtsH ... 43.1 2e-04
tr|Q82QV8|Q82QV8_STRAW Putative AAA family ATPase OS=Streptomyc... 41.6 3e-04
tr|A1SDV1|A1SDV1_NOCSJ ATP-dependent zinc metalloprotease FtsH ... 42.0 4e-04
tr|Q47KU4|Q47KU4_THEFY ATP-dependent zinc metalloprotease FtsH ... 42.0 5e-04
tr|Q82EE9|Q82EE9_STRAW ATP-dependent zinc metalloprotease FtsH ... 41.6 5e-04
tr|Q82EB8|Q82EB8_STRAW Putative ATP-dependent Clp protease OS=S... 41.6 7e-04
sp|P9WQN3|FTSH_MYCTU ATP-dependent zinc metalloprotease FtsH OS... 41.2 7e-04
tr|B0RHW4|B0RHW4_CLAMS ATP-dependent zinc metalloprotease FtsH ... 41.2 8e-04

Из выдачи видно, что лучшие находки имеют такую же функцию как и белок бактерии E.coli, т.е. АТФ-связывающие субъединицы ClpX АТФ-зависимой протеазы Clp. Далее идут белки с другими функциями и их Score напорядок ниже, самая крупная группа среди них - АТФ-зависимые цинк-металлопротеазы.

Таблицa 1. Отобранные актинобактерии
Название Мнемоника
1 Leifsonia xyli

LEIXX

2 Clavibacter michiganensis

CLAMS

3 Bifidobacterium longum

BIFLO

4 Streptomyces avermitilis

STRAW

5

Thermobifida fusca

THEFY

6

Mycobacterium leprae

MYCLE

7

Corynebacterium diphtheriae

CORDI

Кекс
Рис.1 Филогенетическое дерево выбранных бактерий

Реконструкция филогении

Реконструкция филогении полученных гомологичных белков была произведена с помощью программы FastME (метод минимальной эволюции) на сайте https://ngphylogeny.fr/ . Визуализация дерева представлена на рисунке 2. Со скобочной формулой дерева, можно ознакомиться по ссылке .

Кекс
Рис 2. Реконструкция дерева найденных гомологов. В три разных цвета покрашены наиболее крупные ортологичные группы.

Из данного дерева (рис. 2) можно выделить пары паралогов и пары ортологов, например:

  1. Паралоги:
  2. Ортологи:
Кекс
Рис 3. "Схлопнутые" ортологичные группы филогенетического дерева гомологичных белков.

Также можно выделить три большие группы ортологов:

  1. Ортологичная группа ClpX (рис. 3, красный цвет) представлена АТФ-связывающей субъединицей ClpX АТФ-зависимой протеазы Clp. В данную группу входят белки, всех рассматреваемых бактерий. Множество листьев в данной кладе присутствуют и в филогенетическом дереве бактерий, тем не менее ветви данной клады выделяют разные множества бактерий по сравнению с филогенетическим деревом бактерий, но все же совпадения присутствуют, так например, ветвь выделяющая кладу, состоящую из белков принадлежащих LEIXX, CLAMS и ветвь выделяющая MYCLE, CORDI присутствует и в дереве бактерий.
  2. Ортологичная группа FtsH (рис. 3, синий цвет) АТФ-зависимой цинковой металлопротеазой FtsH. В данную группу входят белки, всех рассматреваемых бактерий. Топология данной клады полностью соответствует топологии филогентического дерева бактерий.
  3. Разнообразная группа maybe Clp (рис. 3, зеленый цвет) состоящая по видимому из белков, входящих в состав Clp-протеаз. Так, например по анотациям белков CLPC_MYCLE и Q6NFB1_CORDI можно понять, что они являются АТФ-связывающими субъединицами ClpС АТФ-зависимой протеазы Clp. Также присутствует белки с предполагаемой функцией - Q82EB8_STRAW. Данная клада отличается от состава листьев дерева бактерий, тем не менее присутствует ветвь выделяющая, как и в дереве бактерий, Q6NFB1_CORDI и CLPC_MYCLE