Отчет за практикум 4

1. Составление списка гомологичных белков, включающих паралоги

Я скачала протеомы, отобранных мной ранее бактерий, и объединила их в один файл. Затем проиндексировала их и с помощью программы blastp провела среди них поиск гомологов белка CLPX_ECOLI.

Таблица 1 Список находок из выдачи blastp

2. Реконструкция и визуализация

Затем с помощью сайта NGPhylogeny.fr я реконструировала дерево найденных гомологов программой FastME со следующими параметрами: "Gamma distributed rates across sites" — No, "Starting tree" — BIONJ, "No refinement", 100 бутстреп реплик.

Дерево в Newick формате
Рис. 1 Дерево найденных гомологов CLPX_ECOLI с bootstrap поддержкой 100, укорененное в среднюю точку. Синим выделена ортологичная группа АТФ-зависимых Clp протеаз. Зеленым - АТФ-зависимых цинковых металлопротеаз.

Считая, что дерево реконструировано верно, привожу примеры пар ортологов и паралогов.
Ортологи: CLPX_BIFLO и CLPX_COREF, RUVB_BIFLO и RUVB_ARTS2, Q6NF92_CORDI и Q8FMG2_COREF.
Паралоги: FTSH_ACIC1 и A0LRB8_ACIC1, Q6NGK1_CORDI и Q6NFB1_CORDI, Q8G871_BIFLO и CLPX_BIFLO.

Рис. 2 То же дерево, что на Рис. 1, но клады ортологичных групп схлопнуты. Группа АТФ-зависимых Clp протеаз (синяя) включает в себя всех рассмариваемых бактерий. Ее топология частично соотвествует топологии эталонного дерева (его можно увидеть здесь): так же вместе выделяются бактерии COREF и CORDI, LEIXX и CLAMS. Группа АТФ-зависимых цинковых металлопротеаз (зеленая) тоже седержит все рассматриваемые бактерии, но, в отличие от синей, ее топология полностью соответствует эталонной.