Филогения паралогов и ортологов у бактерий

Выбор видов и бласт

Для поиска гомологов для белка CLPX_ECOLI были выбраны вот эти протеомы бактерий:

Сгрузили их вместе, сделали по ним базу данных и по ней бластовали.

cat *.fasta > all_proteomes.fasta
makeblastdb -in all_proteomes.fasta -dbtype prot -out pseudomonadota_db
blastp -query CLPX_ECOLI.faa -db pseudomonadota_db -outfmt 6 -evalue 0.0001 -out clpx_homologs.txt 

выдача

fastme -i ali_Seqs.phy -o p_dist_Seqs.tre -pp-distance
Newick дерева

Паралоги и ортологи

Примеры паралогов по построенному древу:

  1. RUVB ROSDO/ и CLPX ROSDO. RUVB участвует в комплексе, который разрешает структуру Холлидея, возникающую во время гомологичной рекомбинации у бактерий. Второй это АТФ-зависимая регуляторная субъединица протеазы ClpXP, находящаяся в митохондриях. Она поддерживает белковый гомеостаз, расщепляя неправильно свернутые белки.
  2. HSLU SHEDO и CLPX SHEDO. HSLU это субъединица АТФазы протеасомного комплекса деградации, она обладает шапероновой активностью. Вторая находка это АТФ-зависимый специфический компонент протеазы Clp, в присутствии ClpB тоже может проявлять шаперонную активность.
  3. HSLU YERPE и A0A5P8YB42 YERPE. Первый белок описан выше, а второй это белок семейства хелатаз магния.

Примеры ортологов по построенному дереву:

  1. HSLU ROSDO и HSLU PSEAE
  2. CLPX NEIMA и A0A5P8YCE6 YERPE
  3. CLPX AROAE и CLPX POLAQ
Bact tree
Рис. 2. Дерево, построенное программой Fastme с моделью JTT, bootstrap 100 реплик, укоренение в среднюю точку, окраска подписей по ортологическим группам.
Bact tree
Рис. 3. Дерево, построенное программой Fastme c моделью JTT, укоренение в среднюю точку, ортологические группы свёрнуты
Bact tree
Рис. 4. Дерево, отражающую истинную филогению бактерий из находок бласта.

В зелёной кладе верны: (YERPE,SHEDO) ;(PSEAE,(YERPE, SHEDO)); (POLAQ,AROAE); (POSDO; ...). Остальные нет.

Красная клада полностью правильно восстановлена.