Работа с KEGG ORTHOLOGY

В базе данных KEGG я прошла по ссылке “metabolic pathways”. В метаболическом пути биосинтезе лизина были выбраны два ряда, катализирующие превращение L-2-Аминоадипата в 5-Аденил-2-аминоадипат(рис 1): K00143 и K14085. map_2.png

Рис 1 - Карта метаболического путу синтеза лизина

Далее по ссылке “Uniprot” были получены идентификаторы белков из приведенных ортологических белков. C помощью сервиса “Retrieve/ID mapping” в Uniprot были получены последовательности в fasta-формате (uniprot-yourlist_K00143.fasta и uniprot-yourlist_K14085.fasta). Они были обработаны скриптом parce.py и после этого последовательности были выровнены в Muscle (muscle_K00143.fasta и muscle_K14085.fasta). Использовался muscle with present protein sequences(fastest speed), в принципе он для выравнивания “closely related sequences”, не знаю, правильно ли это. Далее выравнивание было открыто в jalview.

В выравнивании оказались небольшие белки

K14085|A0A059C079_EUCGR K00143|C5MF38_CANTT K14085|R7SL24_DICSQ K14085|B6TPU3_MAIZE K14085|B9T896_RICCO K14085|A0A061GBP2_THECC K14085|F0ZJQ6_DICPU K00143|E9EM15_METRA K00143|A9US27_MONBE

которые были очень плохо выровнены со всеми остальными, они были удалены из выравнивания. В целом прослеживается некоторое количество кластеров, консервативных во всех белках обоих рядов. Стоит отметить то, что последовательности из ряда K14085 в целом намного короче тех, что из ряда K00143 (это в частности помешало понять, какие белки выбрасывать, а какие оставлять). Это могло произойти в связи с утратой некоторых ненужных доменов у K14085.

К сожалению по неведомым причинам мой jalview не может сохранить jalview проект(зависает), поэтому прикладываю выравнивания, которые можно в jalview открыть: исходное(без удаление белков) и и с удаленными белками

“Чистое” выравнивание было открыто в MEGA, далее было построено дерево методом Maximum likelyhood с бутстрепом из 100 реплик. 1.png 2.png

Рис 2 Bootstrap consensus tree

Дерево распадается на клады, соответствующие ортологическим рядам. Ветви, отделяющие клады друг от друга, достоверны, их поддержка около 100%. Внутри клад все ветви имеют сходную длину.