Практикум 4. Паралоги, визуализация.

Составление списка гомологичных белков, включающих паралоги

Поиск гомологов белка CLPX_ECOLI производился с помощью blastp с порогом evalue в 0.001 в базе данных, созданных из протеомов рассматриваемых бактерий.
В результате удалось получить следующие находки.

ID Name E-value Score
CLPX_STRAW ATP-dependent Clp protease ATP-binding subunit ClpX 0.0 535
Q1AVT0_RUBXD ATP-dependent Clp protease ATP-binding subunit ClpX 0.0 524
CLPX_MYCVP ATP-dependent Clp protease ATP-binding subunit ClpX 0.0 523
CLPX_MYCTU ATP-dependent Clp protease ATP-binding subunit ClpX 0.0 519
CLPX_MYCLE ATP-dependent Clp protease ATP-binding subunit ClpX 0.0 519
CLPX_ARTS2 ATP-dependent Clp protease ATP-binding subunit ClpX 0.0 516
CLPX_LEIXX ATP-dependent Clp protease ATP-binding subunit ClpX 1.10e-180 509
CLPX_BIFLO ATP-dependent Clp protease ATP-binding subunit ClpX 9.93e-150 432
A0K1M3_ARTS2 ATPase AAA-2 domain protein 6.36e-08 54.3
Q1AU05_RUBXD ATPase AAA-2 3.41e-07 52.0
Q8G871_BIFLO Protease 7.61e-07 51.2
Q1AY82_RUBXD ATPase AAA-2 1.81e-04 43.5
RUVB_BIFLO Holliday junction ATP-dependent DNA helicase RuvB 1.92e-04 42.7
Q6ACQ0_LEIXX ATP-dependent zinc metalloprotease FtsH 2.16e-04 43.1
Q8G3S2_BIFLO ATP-dependent zinc metalloprotease FtsH 2.17e-04 43.1
A1TG29_MYCVP ATPase AAA-2 domain protein 2.46e-04 43.1
RUVB_ARTS2 Holliday junction ATP-dependent DNA helicase RuvB 3.11e-04 42.4
Q82QV8_STRAW Putative AAA family ATPase 3.88e-04 41.6
A0JR82_ARTS2 ATP-dependent zinc metalloprotease FtsH 5.82e-04 41.6
A0K236_ARTS2 AAA ATPase, central domain protein 5.92e-04 41.6
Q82EE9_STRAW ATP-dependent zinc metalloprotease FtsH 6.12e-04 41.6
A1TG43_MYCVP ATP-dependent zinc metalloprotease FtsH 6.71e-04 41.6
Q82EB8_STRAW Putative ATP-dependent Clp protease 7.69e-04 41.6
FTSH_MYCTU ATP-dependent zinc metalloprotease FtsH 7.93e-04 41.2
FTSH_RUBXD ATP-dependent zinc metalloprotease FtsH 0.001 40.8
FTSH_MYCLE ATP-dependent zinc metalloprotease FtsH 0.001 40.8
CLPC_MYCLE Probable ATP-dependent Clp protease ATP-binding subunit 0.001 40.4

Реконструкция и визуализация

На основе выравненных с помощью MAFFT последовательностей белков с помощью алгоритма Neighbour joining
в программе MEGA было получено следующее филогенетическое дерево.
В полученном дереве можно выделить следующие пары ортологов и паралогов:

Ортологи Паралоги
CLPX ARTS2 - CLPX STRAW CLPC MYCLE - CLPX MYCLE
FTSH MYCLE - FTSH MYCTU Q82EE9 STRAW - CLPX STRAW
Q82EB8 STRAW - CLPC MYCLE Q8G871 BIFLO - Q8G3S2 BIFLO

Изображения дерева

Рис.1 Реконструкция филогенетического дерева найденных белков

Рис.2 Реконструкция филогенетического дерева с объеденненными ортологичными группами

Ортологичные группы:

ClpX (АТФ-зависимый компонент протеазы Clp): в данную ортологичную группу попали белки из всех исследуемых бактерий, однако топология поддерева, принадлежащего данной группе, не соответсвует правильному дереву.
ClpС (АТФ-зависимый AТФ-связывающий компонент протеазы Clp): в данную ортологичную группу не попали белки из Mycobacterium tuberculosis и Leifsonia xyli, топология поддерева, принадлежащего данной группе, не соответсвует правильному дереву. Многие белки из данной группы являются предсказанными, поэтому имеют сильно различающиеся аннотации, однако все ещё можно делать вывод об их ортологичности, т.к. аннотация по белковым доменам у всех них одинакова.
FtsH (АТФ-зависимая цинковая металлопептидаза): в данную ортологичную группу попали белки из всех исследуемых бактерий, топология поддерева, принадлежащего данной группе, не соответсвует правильному дереву.
RuvB (АТФ-зависимая хеликаза, участвующая в устранении структур Холлидея): в данную ортологичную группу, которую можно выделить на основе функции представленных в ней белков, попало только два белка из Arthrobacter sp. и Bifidobacterium longum.