Практикум 4.

Задание 1. Составление списка гомологичных белков

Протеомы выбранных мной бактерий были объединены в один fasta-файл. Белки в геномах бактерий были проиндексированы и по ним осуществлялся поиск гомологов белка CLPX_ECOLI с E-value равным 0.001. Файл выдачи доступен по ссылке.

Задание 2. Реконструкция и визуализация

Создал fasta-файл с последовательностями находок и их ID. Для реконструкции дерева найденных гомологов загрузил этот файл в программу FastME c параметрами: "Gamma distributed rates across sites" — No, "Starting tree" — BIONJ, "No refinement", 100 бутстреп реплик. Формула Newick доступна по ссылке.

С помощью плученного дерева (рис.1.) определил ортологов (обозначены одним цветом на рис.1.) и паралогов.

Паралоги: HSLU_ECOLI и CLPX_ECOLI, HSLU_YERPE и CLPX_YERPE, Q92M98_RHIME и HSLU_RHIME.

Ортологи: HSLU_ECOLI и HSLU_SERP5, HSLU_YERPE и A5FYD7_ACICJ, CLPX_ACICJ и CLPX_RHIME.

Рис. 1. Дерево гомологов белка CLPX_ECOLI в наборе бактерий, укоренное в среднюю точку.
Рис. 2. Дерево, ортологичные группы на котором "схлопнуты". Все группы включают белки из каждой бактерии. В красную группу входят АТФ-зависимые цинковые металлопротеазы. Филогения этих белков немного отличается от бактерий. В синюю группу входят АТФ-связывающие субъединицы HslU протеасомоподобного комплекса деградации. Филогения этих белков соответствует бактериям. В зеленую группу входят АТФ-связывающие субъединицы ClpX протеазы Clp. Филогения этих белков соответствует бактериям.