Практикум 4. Практические аспекты реконструкции филогении

Задание 1

Составление списка гомологичных белков, включающих паралоги

Из протеомов выбранных бактерий были сформированы базы данных blast. Затем был выполнен поиск последовательностей в них (последовательностей, гомологичных белку CLPX_ECOLI) Порог e-value 0.001, формат выдачи в виде таблицы.

Файл выдачи с найденными белками можно скачать по ссылке.

Задание 2

Полученные последовательности в Jalview были загружены в ngphylogeny.fr, построено дерево ( FastME c параметрами c параметрами: "Gamma distributed rates across sites" — No, "Starting tree" — BIONJ, "No refinement", 100 бутстреп реплик.)

Затем дерево было укоренено в middlepoint, поддержка bootstrap отображена.

Рис.1. Укорененное дерево белковых последовательностей с поддержкой bootstrap Дерево в формате Newick доступно по ссылке.

Ортологи: CLPX_YERPE и CLPX_SERP5; HSLU_YERPE и HSLU_SERP5; A8G901_SERP5 и A0A5P8YCE6_YERPE

Паралоги: CLPX_YERPE и HSLU_YERPE; FTSH_HAEIN и HSLU_HAEIN; CLPX_NEIMA и RUVB_NEIMA

Рис.2. Выделение ортологичных групп

Рис.3. Дерево белковых последовательностей с схлопнутыми ортологичными группами

Рассмотрим ортологичные группы:

Зеленая - HSLU белки (АТФ-зависимый сабъюнит АТФ-зависимой протеазы HslU) 5 бактерий из 7 (не входит POLAQ, NEIMA)

Сереневая - CLPX белки(АТФ-связывающий сабъюнит АТФ-зависимой протеазы Clp) 7 бактерий из 7.

Розовая - АТФ-зависимая цинковая металлопротеаза FtSH 5 бактерий из 7 (не входит NEIMA, PSEMY)