Ортологи и паралоги

Необходимо было найти гомологочные последовательности субъединице АТФ-зависимой протеазы из семейства CLP из организма E.coli. Вначале была скачана последовательность белка CLPX_ECOLI из базы данных Uniprot. Для поиска гомологов была создана локальная база данных на основе протеомов 7 бактерий из предыдущего практикума:
makeblastdb -dbtype prot -in proteom.fasta
Эта база данных подавалась на вход программе blastp с порогом на e-value 0.001:
blastp -query clpx_ecoli.fasta -db XXX -evalue 0.001 -out XXX.blast
Результат работы blastp здесь.
Далее были выбраны идентификаторы белков, последовательности собраны из базы данных в новый файл.

Файл был импортирован в Jalview. Далее с помощью алгоритма muscle последовательности были выравнены.


Реконструкция и визуализация

По выравненным последовательностям в MEGA, было построено дерево с помощью алгоритма Neighbour-joining.

Скобками были объеденены крупные группы ортологов (ClpX, FtsH).
Паралоги: FTSH RUBXD и Q1ATZ9 RUBXD, CPLX CLAMS и B0RHW4 CLAMS, CLPX MYCVP и A1TG43.
Ортологи: FTSH MYCTU и FTSH RUBXD, CPLX CORDI и CPLX MYCTU.

ClpX - АТФ-зависимая протеаза Clp АТФ-связывающая субъединица. Найдена у всех бактерий. FtSH - АТФ-зависимая цинковая металлопротеаза. Также найдена у всех бактерий.
Реконструированная филогения белка ClpX и филогения бактерий не полностью соответствуют, т.к. ветвь бактерии Clavibacter michiganensis(CLAMS) не должна находиться на нертевиальной ветви с кладой CORDI,COREF и нетревиальной ветвью RHOJR(MYCTU,MYCVP). Реконструированная филогения белка FtsH и филогения бактерий полностью соответствуют. Все нетревиальные ветви правильно расположены.