Работа с KEGG ORTHOLOGY

Выбор пары ортологических рядов для дальнейшей работы

В базе данных KEGG был выбран метаболический путь аскорбатов и альдоратов - Ascorbate and aldarate metabolism . На карте была выбрана реакция с идентификатором 3.1.3.93 - превращения L-галактозы-1P в L-галактозу(рис.1) В данной реакции участвуют два ряда ортологичных белков: K10047 (74 белка) и K18649 (48 белков).

Рис.1. Схема реакции, катализируемой ферментами ортологических рядов K10047 и K18649


Рис. 2. Метаболический путь аскорбатов и альдоратов (KEGG)

Были получены последовательности из двух ортологических рядов: K10047 (fasta) и K18649 (fasta) . Далее было построено множественное выравнивание всех последовательностей из всех обнаруженных ортологических рядов с помощью программы Muscle (ссылка на проект JalView).

Проверка выравнивания

В выравнивании были белки, которые очень плохо выровнены с остальными: C5WU54|C5WU54_SORBI, B5YMW3|B5YMW3_THAPS. Они относятся к ортологическому ряду K10047. Эти последовательности были удалены из выравнивания для дальнейшей работы.

Также из выравнивания были удалены белки(~ 13 штук), содержащие много гэпов в тех участках, где в других последовательностях выравнивания консервативные колонки. . В итоге в выравнивании осталось 63 посдеовательности из ортологическог ряда K10047 и 45 - из K18649, причем визуально разница между этими двумя ортологоческими рядами очень заметна: у белков из K10047 больше консервативных блоков. На рис. 3 приведено изображение полученного выравнивания.

Рис. 3. Выравнивание белков из ортологичных рядов K10047 и K18649

Гомологичность белков в выравнивании

В полученном выравнивании наблюдается наличие 6 косервативных колонок. Кроме того, можно заметить довольно большие консервативные блоки. Исходя из этого, можно сделать вывод о том, что множественное выравнивания для анализируемых белков существует. Следовательно, на его основе можно построить дерево.

Построение филогенетического дерева

На основе полученного выравнивания было построено дерево в программе MEGA (методом Neighbor-Joining, со 100 бутстреп-репликами). Дерево было построено на основе 108 последовательностей и 189 позиций выравнивания(аминокислотных остатков). Дерево распадается на клады, полностью соответствующие ортологическим рядам K10047(верхняя) и K18649(нижняя). Величина поддержки бутстрепом этой ветви составляет 99. В данном дереве тривиальные ветви различаются по длине, причем наблюдается следующая закономерность: чем длиннее ветвь, тем меньше консервативных позиций у этой последовательности во множественном выравнивании.

Рис. 4. Дерево белков построенное методом Neighbor-Joining



© Васильева Елена, 2015