Работа с KEGG ORTHOLOGY
Выбор пары ортологических рядов для дальнейшей работы
В базе данных KEGG был выбран метаболический путь аскорбатов и альдоратов -
Ascorbate and aldarate metabolism .
На карте была выбрана реакция с идентификатором 3.1.3.93 - превращения L-галактозы-1P в L-галактозу(рис.1) В данной реакции участвуют два ряда ортологичных белков:
K10047 (74 белка) и K18649 (48 белков).
 |
Рис.1. Схема реакции, катализируемой ферментами ортологических рядов
K10047 и K18649 |
 |
Рис. 2. Метаболический путь аскорбатов и альдоратов (KEGG)
| |
Были получены последовательности из двух ортологических рядов: K10047 (fasta) и K18649 (fasta) .
Далее было построено множественное выравнивание всех последовательностей из всех обнаруженных ортологических рядов с помощью программы Muscle
(ссылка на проект JalView).
Проверка выравнивания
В выравнивании были белки, которые очень плохо выровнены с остальными: C5WU54|C5WU54_SORBI, B5YMW3|B5YMW3_THAPS.
Они относятся к ортологическому ряду K10047. Эти последовательности были удалены из выравнивания для дальнейшей работы.
Также из выравнивания были удалены белки(~ 13 штук), содержащие много гэпов в тех участках, где в других последовательностях выравнивания консервативные колонки.
. В итоге в выравнивании осталось 63 посдеовательности из ортологическог ряда K10047 и 45 - из K18649, причем
визуально разница между этими двумя ортологоческими рядами очень заметна: у белков из K10047 больше консервативных блоков. На рис. 3 приведено изображение полученного выравнивания.
 |
Рис. 3. Выравнивание белков из ортологичных рядов K10047 и K18649
| |
Гомологичность белков в выравнивании
В полученном выравнивании наблюдается наличие 6 косервативных колонок. Кроме того, можно заметить довольно большие консервативные блоки. Исходя из этого, можно сделать вывод о том,
что множественное выравнивания для анализируемых белков существует. Следовательно, на его основе можно построить дерево.
Построение филогенетического дерева
На основе полученного выравнивания было построено дерево в программе MEGA (методом Neighbor-Joining, со 100 бутстреп-репликами). Дерево было построено на основе 108 последовательностей
и 189 позиций выравнивания(аминокислотных остатков).
Дерево распадается на клады, полностью соответствующие ортологическим рядам K10047(верхняя) и K18649(нижняя). Величина поддержки бутстрепом этой ветви составляет 99. В данном дереве
тривиальные ветви различаются по длине, причем наблюдается следующая закономерность: чем длиннее ветвь, тем меньше консервативных позиций у этой последовательности во
множественном выравнивании.
 |
Рис. 4. Дерево белков построенное методом Neighbor-Joining
| |