В базе данных KEGG я прошла по ссылке “metabolic pathways”. В метаболическом пути биосинтезе лизина были выбраны два ряда, катализирующие превращение L-2-Аминоадипата в 5-Аденил-2-аминоадипат(рис 1): K00143 и K14085.
Рис 1 - Карта метаболического путу синтеза лизина
Далее по ссылке “Uniprot” были получены идентификаторы белков из приведенных ортологических белков. C помощью сервиса “Retrieve/ID mapping” в Uniprot были получены последовательности в fasta-формате (uniprot-yourlist_K00143.fasta и uniprot-yourlist_K14085.fasta). Они были обработаны скриптом parce.py и после этого последовательности были выровнены в Muscle (muscle_K00143.fasta и muscle_K14085.fasta). Использовался muscle with present protein sequences(fastest speed), в принципе он для выравнивания “closely related sequences”, не знаю, правильно ли это. Далее выравнивание было открыто в jalview.В выравнивании оказались небольшие белки
K14085|A0A059C079_EUCGR K00143|C5MF38_CANTT K14085|R7SL24_DICSQ K14085|B6TPU3_MAIZE K14085|B9T896_RICCO K14085|A0A061GBP2_THECC K14085|F0ZJQ6_DICPU K00143|E9EM15_METRA K00143|A9US27_MONBE
которые были очень плохо выровнены со всеми остальными, они были удалены из выравнивания. В целом прослеживается некоторое количество кластеров, консервативных во всех белках обоих рядов. Стоит отметить то, что последовательности из ряда K14085 в целом намного короче тех, что из ряда K00143 (это в частности помешало понять, какие белки выбрасывать, а какие оставлять). Это могло произойти в связи с утратой некоторых ненужных доменов у K14085.
К сожалению по неведомым причинам мой jalview не может сохранить jalview проект(зависает), поэтому прикладываю выравнивания, которые можно в jalview открыть: исходное(без удаление белков) и и с удаленными белками
“Чистое” выравнивание было открыто в MEGA, далее было построено дерево методом Maximum likelyhood с бутстрепом из 100 реплик.
Рис 2 Bootstrap consensus tree
Дерево распадается на клады, соответствующие ортологическим рядам. Ветви, отделяющие клады друг от друга, достоверны, их поддержка около 100%. Внутри клад все ветви имеют сходную длину.