Работа с KEGG ORTHOLOGYВыбор пары ортологических рядов для дальнейшей работы
![]() Рис. 1. Схема метаболического пути. Синим отмечен выбранный EC (3.2.2.5). Получение совместного множественного выравниванияСо страницы ортологических рядов, по ссылке Uniprot (справа, в доп. колонке All links), я перешел на страницу со всеми ID моих белков. Далее через сервис Retrieve/ID mapping я, по своим ID, получил последовательности моих белков в fasta формате (параметры: UniProtKB AC/ID - UniProtKB), скачав их всех в одном файле. В итоге я получил два разных файла для двух рядов (K18153.fasta и K19980.fasta). С помощью сервиса Muscle (через Jalview) построено выравнивание. ![]() Рис. 2. Выравнивание Muscle со стандартными параметрами. Проверка гомологичности белков в выравниванииДля начала я слегка улучшил выравнивание, произведя следующие манипуляции: 1) Вручную выровнял между собой группу K19980 2) Из группы K18153 сильно выбивается C0M7T1, так что я его выкинул из рассмотрения (много гэпов и замен). По итогу я работал уже с таким выравниванием: ![]() Рис. 3. Улучшенное выравнивание Muscle. Посмотрев на это выравнивание, я пришел к следующим выводам: 1) K18153 довольно-таки близки к друг-другу. 2)Хоть и мало известных представителей K19980, однако между собой они также похожи (это видно на картинке внизу). 3) Возникают сомнения в ортологичности K18153 и K19980. Однако, K19980 - млекопитающие(мыши и крыса), а K18153 - грамположительные бактерии (стрептококки). Так что различие этих двух групп довольно предсказуемы. ![]() Рис. 4. Выравнивание K19980. Рисунок 4 подтверждает, что между собой последовательности K19980 похожи. ДеревоИз выравнивания следует, что скорее всего эти ряды не являются ортологами, исходя из чего дерево я строить не стал. Так как один ряд представлен только прокариотами, а второй - эукариотами (грызунами), то можно предположить, что эти белки просто приобрели общую функцию в ходе эволюции, но общего предка-белка не имеют. В принципе, это довольно обычное дело для про- и эу-кариот.
|