Для получения списка белков-гомологов для CLPX_ECOLI использовалась программа blastp:
Использовались 7 протеомов, результат выдачи (полный файл):
Следующий этап это выделение последовательностей в формате fasta. Из выдачи blastp выбираем белки с наилучшим показателем e-value и выравниваем последовательности (файл|выравнивание):
Далее формат файла изменили на phylip-relaxed и построили дерево программой iqtree (Newick):
Будем считать дерево реконструированным верно несмотря на подозрительную ветвь RUVB_ROSDO, которая является частью комплекса, учавствующего в разрешении структуры Холлидея. В таком случае оценим наличие паралогов и ортологов:
Ортологи | Паралоги |
(CLPX_BORPE; CLPX_BRUSU) | (CLPX_BORPE; HSLU_BORPE) |
(HSLU_BORPE; HSLU_BRUSU) | (CLPX_HAEIN; HSLU_HAEIN) |
(HSLU_ROSDO; HSLU_ACICJ) | (CLPX_ROSDO; RUVB_ROSDO) |
Сопоставление с филогенией: HSLU - согласуется с филогенией, CLPX - практически полностью согласуется, BRUSU должно быть ближе с ROSDO нежели с ACICJ