KEGG, занятие 5

Задание 1

Выбран метаболический путь инозитолфосфата, в KEGG pathway выглядящий следующим образом (выбранная реакция окрашена средствами KEGG: User data mapping, в открывшемся окне задать цвет в формате R03393 #44FF44):

Для изучения была выбрана реакция R03393 (фосфорилирование миоинозитол-4-ортофосфата):

Реакцию катализируют два семейства ортологов:
K01107 61 ген в семействе список идентификаторов fasta семейства
K15422 66 генов в семействе список идентификаторов fasta семейства
Для обоих семейств fasta-файлы были получены запросом списка id в uniprot (retrieve mapping / id). Id получили прибавку К01107 или К15422 в зависимости от принадлежности к соответствующему семейству, семейства - сведены в единый файл, файл - выровнен в JalView с помощью MUSCLE. Результаты: файл с выравниванием, файл проекта JalView до редактирования выравнивания, вид фрагмента выравнивания:

Редактирование выравнивания привело к удалению генов Q6PB10, I1E8Q6, A4HJT1 из K01107 и A0A072UPX7, I4SX75, I4T781 из K15422. Оставшиеся 121 последовательность были перевыровнены, в результате нашлось ещё 5 плохо выравнивемеых: Q57YS3 и H9JSE7 из семейства K01107 и R7QQQ1, R7QSW7 и C1N5L7 из семейства K15422. В целом белки семейства K01107 выровнены хуже. Результаты: файл с новым выравниванием, файл проекта JalView после редактирования выравнивания, вид фрагмента выравнивания после редактирования:

Построение дерева в MEGA дало следующую картину:

  • Оргинальное дерево:

  • Дерево, построенное по Neighbor-Joining, количество bootstrap-реплик 100:

Подписи над ветвями обозначают их частоту совпадения при различных построениях. Оригинальное дерево укоренено в ветвь, разделяющую 2 семейства. Длины его ветвей соответствуют различиям в выравнивании. Bootstrap-дерево учитывает только частоту встречаемости ветви при построении деревьев, полученных случайной заменой 50% последовательностей. Поэтому оно переукоренено и длины ветвей выровнены, и некоторые белки оказались не в своём семействе. По деревьям видно, что белки разных ортологических семейств хорошо различимы. Хотя белки семейства K01107 в трёх случаях оказались в том же узле, что и белки К15422, эти случаи таковы: один - тривиальная ветвь, а другие два идут с большим расстоянием, и очень плохо поддерживаются bootstrap'ом. В выравнивании эти белки совпадают с консенсусом довольно неплохо. В целом белки семейства K15422 имеют большую схожесть между собой, чем белки семейства K01107, это видно и на выравнивании.