1. Выбор пары ортологических рядов для дальнейшей работы
Я выбрала метаболический путь Steroid hormone biosynthesis (биосинтез стероидных гормонов). Cхема - на рис.1. Я выбрала реакцию EC - 1.14.15.4 (steroid 11beta-monooxygenase). На рис.1 выделена зеленым. У нее было 2 ортологичных ряда: K00497 (16 последовательностей) и K07433 (4 последовательности).
Рис.1. Схема биосинтеза стероидных гормонов.
2. Получение совместного множественного выравнивания
Из Uniprot я скачала все последовательности белков из этих кластеров и построила их множественное выравнивание Muscle. Ссылка на проект Jalview. Выравнивание на рис.2.
Рис.2. Выравнивание белков кластеров K07433 и K00497.
3. Проверка гомологичности белков в выравнивании
Первые 4 сверху белка на рис.2 несколько отличаются от остальных. Но, во-первых, отличия несущественные, а во вторых, они не относятся все к отдельному ортологическому ряду. Поэтому их оставляем. Далее, почти все белки примерно одинаковой длины, хотя первые 3 белка немного длиннее за счет нескольких небольших вставок.. Поэтому удаления более коротких белков тоже не будет. Можно сказать, что все белки гомологичны.
4. Построение филогенетического дерева
Построено филогенетическое дерево (программой MEGA, методом Neighbor-Joining, со 100 бутстреп-репликами). Результат - на рис.3. Необычно то, что дерево не распадается на клады, разделяющие ортологичные ряды.
Рис.3. Дерево белков кластеров K07433 и K00497.