Протеомы выбранных мной бактерий были объединены в один fasta-файл. Белки в геномах бактерий были проиндексированы и по ним осуществлялся поиск гомологов белка CLPX_ECOLI с E-value равным 0.001. Файл выдачи доступен по ссылке.
Создал fasta-файл с последовательностями находок и их ID. Для реконструкции дерева найденных гомологов загрузил этот файл в программу FastME c параметрами: "Gamma distributed rates across sites" — No, "Starting tree" — BIONJ, "No refinement", 100 бутстреп реплик. Формула Newick доступна по ссылке.
С помощью плученного дерева (рис.1.) определил ортологов (обозначены одним цветом на рис.1.) и паралогов.
Паралоги: HSLU_ECOLI и CLPX_ECOLI, HSLU_YERPE и CLPX_YERPE, Q92M98_RHIME и HSLU_RHIME.
Ортологи: HSLU_ECOLI и HSLU_SERP5, HSLU_YERPE и A5FYD7_ACICJ, CLPX_ACICJ и CLPX_RHIME.