Работа с KEGG ORTHOLOGY

Задание 1: Выбор пары ортологических рядов для дальнейшей работы.

В данном задании сначала необходимо было выбрать любой метаболический путь в базе данных KEGG.
Был выбран: M00089 - Triacylglycerol biosynthesis (название на русском: биосинтез триглицерида).
Также была выбрана рекция R02239 (Phosphatidate + H2O <=> 1,2-Diacyl-sn-glycerol + Orthophosphate). Она изображена на рис. 1. Она имеет 2 EC: 3.1.3.4 и 3.1.3.81.

Рис. 1 - Схема реакции R02239



Были взяты 2 ортологических ряда белков с идентификаторами: K01096 и K18693 (EC 3.1.3.81). Выбирать не приходилось, так как в наличии были всего 2 ряда. Необходимо было сохранить ссылку на страницы рядом в БД KEGG ORTHOLOGY (ссылка> и картинку метаболического пути с реакцией, покрашенной в фиолетовый (рис. 2).
Количество последовательностей белков (UniProt): K01096 - 279; K18693 - 126.
Количество генов: K01096 - 540; K18693 - 152.

Рис. 2 - Изображение метаболического пути

Задание 2: Получение совместного множественного выравнивания.

В данном задании необходимо было получить последовательности для каждого ортологического ряда и построить множественное выравнивание из ортологических рядов с помощью программы Muscle. Последовательности были получены с помощью их ID с UniProt и с помощью скрипта Python названия были изменены (вид: ID_организм|ортологический ряд).
Ссылка на проект с множественным выравниванием JalView

Задание 3: Проверка гомологичности белков в выравнивании.

В данном задании необходимо было осуществить проверку выравнивания. Для этого необходимо было удалить из выравнивания короткие белки, которые содержат много гэпов, и белки, которые плохо выровнены с остальными. Были удалены 2 короткие последовательности (менее 100 аминокислот), а таже 4 слишком длинные (более 440). Однако, можно заметить, что белки 2 ортологических рядов не выравниваются между собой. Белки ряда K01096 относительно неплохо выравниваются между собой. Ряд K18693 плохо выравнивается, поэтому можно сказать, что общей гомологии не наблюдается.
Ссылка на проект JalView с 5 удаленными последовательностями

Задание 4: Построение филогенетического дерева.

В данном случае дерево построить нельзя, так как множественного выравнивания не существует. Гомология белков не была показана, поэтому построенное дерево не может быть признанным благонадежным.