В данном задании сначала необходимо было выбрать любой метаболический путь в базе данных KEGG.
Был выбран: M00089 - Triacylglycerol biosynthesis
(название на русском: биосинтез триглицерида).
Также была выбрана рекция R02239
(Phosphatidate + H2O <=> 1,2-Diacyl-sn-glycerol + Orthophosphate).
Она изображена на рис. 1. Она имеет 2 EC: 3.1.3.4 и 3.1.3.81.
Рис. 1 - Схема реакции R02239
Рис. 2 - Изображение метаболического пути
В данном задании необходимо было получить последовательности для каждого ортологического ряда
и построить множественное выравнивание из ортологических рядов с помощью программы Muscle.
Последовательности были получены с помощью их ID с UniProt и с помощью скрипта Python
названия были изменены (вид: ID_организм|ортологический ряд).
Ссылка на проект с множественным выравниванием JalView
В данном задании необходимо было осуществить проверку выравнивания.
Для этого необходимо было удалить из выравнивания короткие белки,
которые содержат много гэпов, и белки, которые плохо выровнены с остальными.
Были удалены 2 короткие последовательности (менее 100 аминокислот), а таже 4 слишком длинные (более 440).
Однако, можно заметить, что белки 2 ортологических рядов не выравниваются между собой.
Белки ряда K01096 относительно неплохо выравниваются между собой.
Ряд K18693 плохо выравнивается, поэтому можно сказать, что общей гомологии не наблюдается.
Ссылка на проект JalView с 5 удаленными последовательностями
В данном случае дерево построить нельзя, так как множественного выравнивания не существует. Гомология белков не была показана, поэтому построенное дерево не может быть признанным благонадежным.