Ферменты и метаболические пути. База данных KEGG.
Выбор пары ортологических рядов для дальнейшей работы
Для работы я выбрала метаболический путь гистидина (Histidine metabolism)
![](map.png)
Рис. 1. Метаболический путь гистидина.
Я выбрала реакцию с ЕС-кодом 1.2.1.3. (На рис. 1 покрашена бирюзовым цветом). <.p>
Ее катализирует 3 ортологических ряда белков:
- K00128 (aldehyde dehydrogenase (NAD+)) (4778 белковых последовательностей в Uniprot) ;
- K00149 (aldehyde dehydrogenase family 9 member A1) (56 белковых последовательностей в Uniprot);
- K14085 (aldehyde dehydrogenase family 7 member A1) (125 белковых последовательностей в Uniprot).
Получение совместного множественного выравнивания
Сначала мы получили последовательности белков из Uniprot c помощью сервиса "Retrieve/ID mapping" этой базы данных.
С помощью скрипта модифицировали идентификаторы.
Итоговые файлы с последовательностями:
K14085.fasta
K00149.fasta
С помощью Muscle построил множественное выравнивание, которое открыли в Jalview и покрасили по Clustalx.
align.fasta
align.jvp
Проверка гомологичности белков в выравнивании
Выравнивание получилось плохого качества. Удалили короткие белки, которые содержали много гэпов в тех участках, где в других последовательностях выравнивания консервативные колонки. Например K7JC23_NASVI|K14085; G4YWR2_PHYSP|K14085; B6TPU3_MAIZE|K14085 и другие. Также удалили такие последовательности как Q4SSM8_TETNG|K00149; A0A158PZE7_BRUMA|K00149, которые длиннее прочих и имеют мало совпадений с другими последовательностями.
Итоговое выравнивание: align_modified.jvp
На рисунке 3 представлен фрагмент итогового выравнивания. Можно отчетливо выделить 2 блока. Гомологичными являются белки одного ряда, но белки двух рядов не гомологичны между собой, т.к. не обнаружено сколько-нибудь больших консервативных блоков между последовательностями из разных ортологических рядов. Таким образом, нельзя говорить о существовании множественного выравнивания.
![](align.png)
Рис. 3. Фрагмент выравнивания, демонстрирующий негомологичность белков двух рядов.
Построение филогенетического дерева
Т.к. последовательности из двух ортологических рядов негомологичны, то нельзя строить дерево, потому что оно не будет нести биологического смысла.