Практикум 4


Список гомологичных белков, включающих паралоги

Я взяла протеомы со следующими мнемониками: ACICJ, AROAE, BORPE, BURMA, HAEIN, PARDP, POLAQ.

Записала последовательности в файл proteomes.fasta, произвела поиск программой blastp гомологов с порогом на E-value 0,0001. Использованные команды:

cat ACICJ.fasta AROAE.fasta BORPE.fasta BURMA.fasta HAEIN.fasta PARDP.fasta POLAQ.fasta > proteomes.fasta

makeblastdb -dbtype prot -in proteomes.fasta -out col

blastp -query CLPX.fasta -db col -evalue 0.0001 -out blastp_result.txt


Файл с выдачей blast
blast
Рис. 1 Выдача программы BLAST

Реконструкция и визуализация

Названия находок поменяла на их мнемоники, сделала выравнивание с помощью muscle. Построила на основе выравнивания дерево программой iqtree.

Файл с формулой (Newick)

Полученное дерево открыла в iTOL и укоренила в среднюю точку.

iq_exp
Рис. 2 Дерево, построенное на основе находок blast с помощью программы iqtree. Разными цветами отмечены ортологические группы.

Пары ортологов:


Пары паралогов:

iq_shlop
Рис. 3 Дерево, построенное на основе находок blast с помощью программы iqtree, со схлопнутыми ортологическими группами: CLPX (отмечена голубым) и HSLU (отмечена красным).

Описание состава группы CLPX

Включает в себя белки всех выбранных организмов.

Реконструированная филогения белков сильно отличаестя от филогении бактерий. Клада с POLAQ, BORPE, BURMA, AROAE реконструирована неверно: POLAQ и BURMA должны были образовывать кладу, вместо этого BURMA образует кладу с AROAE. Также должна быть клада из POLAQ, BORPE, BURMA, AROAE и HAEIN, вместо этого образовалась клада из HAEIN с PARDP и ACICJ.


Описание состава группы HSLU

Включает в себя белки всех выбранных организмов за исключением POLAQ.

Реконструированная филогения отличается от филогении бактерий только тем, что HAEIN не образует отдельной клады с BORPE и BURMA, в остальном видно соответствие.