Практикум 4

Составление списка гомологичных белков, включающих паралоги

Для выполнения практикума были выбраны протеомы 7 бактерий отдела Pseudomonadota:

Протеомы выбранных бактерий были объединены в один файл с помощью следующей команды:

cat AROAE.fasta BORPE.fasta BURMA.fasta HAEIN.fasta NEIMA.fasta PASMU.fasta ROSDO.fasta > ~/term4/practice4/db.fasta

Файлы с протеомами были взяты из директории /P/y22/term4/Proteomes.

Затем была создана локальная база данных для дальнейшего запуска BLASTP:

makeblastdb -in db.fasta -dbtype prot

Далее на основе созданной базы данных был произведён поиск гомологов белка CLPX_ECOLI с порогом Е-value, равным 0,0001:

blastp -task blastp -query CLPX_ECOLI.fasta -db db.fasta -out blast_result.out -evalue 0.0001

Рис. 1. Список находок для CLPX_ECOLI из выдачи BLASTP (без заголовка выдачи и выравниваний).

Реконструкция и визуализация

Дерево было реконструировано с помощью программы FastME по модели p-distance.

дерево найденных гомологов в формате Newick

Рис. 2. Реконструкция дерева полученных гомологов с помощью программы FastME по модели p-distance. Цветом обозначены разные ортологические группы на дереве.

Ортологи: CLPX_PASMU и CLPX_HAEIN; CLPX_BORPE и CLPX_BURMA; HSLU_PASMU и HSLU_HAEIN; HSLU_AROAE и HSLU_BORPE.

Паралоги: CLPX_HAEIN и HSLU_HAEIN; CLPX_ROSDO и HSLU_ROSDO; CLPX_BURMA и HSLU_BURMA.

Рис. 3. Реконструкция дерева найденных гомологов со схлопнутыми ортологическими группами.

В ортологической группе (CLPX), выделенной голубым цветом, присутствует последовательность каждой из 7 выбранных бактерий, а в ортологической группе (HSLU), отмеченной розовым, присутствует только 6 последовательностей (нет последовательности NEIMA).

Если сравнивать реконструкции ортологических групп с филогенией бактерий (смотри Рис. 3. ниже), то клада ортологов HSLU соотвествует филогении бактерий, а в кладе CLPX последовательность CLPX_ROSDO, а не CLPX_NEIMA, должна являться внешней группой по отношению ко всей рассматриваемой кладе, то есть в данной кладе ортологов CLPX_NEIMA и CLPX_ROSDO надо поменять местами. Ещё, судя по филогении бактерий, клада (CLPX_BORPE, (CLPX_AROAE, CLPX_BURMA)) дожна выглядеть следующим образом (CLPX_AROAE, (CLPX_BORPE, CLPX_BURMA)).

Рис. 4. Филогения выбранных бактерий.