Практикум 4

1. Составление списка гомологичных белков, включающих паралоги

Для поиска белков, гомологичных CLPX_ECOLI в протеомах бактерий, эти протеомы были собраны в один файл. На основе полученного файла была создана локальная база данных для запуска blastp. Blastp был запущен при параметрах Е-value - 0.001. В результате было получено 20 находок, которые можно увидеть здесь

2. Реконструкция и визуализация

Затем были использованы белковые последовательности находок blast для построения дерева. Использовалась программа FastME с параметрами:

"Gamma distributed rates across sites" — No

Starting tree — BIONJ

No refinement

100 бутстреп реплик

Письма мастера дзен Рис1. Дерево гомологов белка CLPX_ECOLI, где группы ортологов покрашены. Красный - ATP-зависимые протеазы Clp, салатовый - ATP-зависимые цинковые металлопротеазы

Полученное дерево было укоренено в среднюю точку.(Рис 1) На дереве можно выделить следующих ортологов: A1TG29 MYCVP и Q0S8C7 RHOJR, Q6NFB1 CORDI и Q8FMH5 COREF, Q0S6Y7 RHOJR и Q1AY82 RUBXD, A1TG43 MYCVP и FTSH MYCTU, CLPX MYCTU и CLPX MYCLE, CLPX COREF и CLPX CORDI; и следующих парологов: RUVB BIFLO и CLPX BIFLO,Q1AY82 RUBXD и Q1AU05 RUBXD, A1TG29 MYCVP и CLPX MYCVP6

На основании полученных данных можно выделить две ортологичные группы: ATP-зависимые протеазы Clp (красный), и ATP-зависимые цинковые металлопротеазы (салатовый).

Упомянутые группы были "схлопнуты".(Рис2)

Письма мастера дзен Рис2.Дерево, в котором ортологичные группы "схлопнуты". Красному треугольнику соответсвует группа ATP-зависимых протеаз Clp. В эту группу попали белки из всех 8 выбранных бактерий. Дерево белков совпало с эталонным деревом организмов. Салатовому треугольнику соответствует группа ATP-зависимых цинковых металлопротеаз. В нее попали белки из 6 бактерий (выбранных 8). Отсутсуют белки из MYCLE и MYCTU, чей клады и не хватает, чтобы дерево белков совпало с эталонным деревом организмов.