1. Составление списка гомологичных белков, включающих паралоги

Сначала был создан файл seq.fasta, в котором содержатся все белковые последовательности 7 бактерий с мнемониками PASMU, YERPE, ECOLI, SACD2, AROAE, HAEIN, NEIMA и BARHE. Далее командой
makeblastdb -dbtype prot -in seq.fasta -out database
была создана база данных для дальнейшего поиска гомологов командой
blastp -query CLPX_ECOLI.fasta -db database -evalue 0.0001 -out result.txt
Результат выдачи можно увидеть здесь. Отдельно найденные гомологи можно увидеть ниже на изображении 1:
photo

Изображение 1.Выдача blastp. Гомологи

2. Реконструкция и визуализация

Все нужные белковые последовательности с сокращенными мнемониками я поместила в файл result.fasta. Также здесь можно найти скобочную формулу получившегося на основании множественного выравнивания белковых последовательностей дерева, которое изображено ниже:
photo

Изображение 2.Дерево найденных гомологов

photo

Изображение 3.Дерево найденных гомологов. Выделенные ортологические группы

Некоторые ортологи: HSLU_NEIMA и HSLU_HAEIN, CLPX_YERPE и CLPX_AROAE, CLPX_SACD2 и CLPX_BARHE и т.д.

Некоторые ортологи: HSLU_BARHE и CLPX_BARHE, CLPX_ECOLI и HSLU_ECOLI, HSLU_YERPE и CLPX_YERPE и т.д.

Наибольшие получившиеся ортологические группы: CLPX(NEIMA, HAEIN, PASMU, BARHE, SACD2, AROAE, YERPE, ECOLI) - ATP-dependent Clp protease ATP-binding subunit ClpX, АТФ связывающая субъединица АТФ зависимой Clp протеазы и HSLU(HAEIN, PASMU, BARHE, SACD2, AROAE, YERPE, ECOLI) - ATP-dependent protease ATPase subunit HslU, АТФ зависящая субъединица АТФ зависимой протеазы HslU.
photo

Изображение 4.Дерево найденных гомологов со схлопнутыми группами

Если сравнивать данные деревья с эталонным, то можно сказать, что оно не полностью соответствует таксономической действительности. Некоторые клады с учетом отсутствия в реконструированных в рамках данного практикума деревьев белков некоторых организмов остаются неизменными: YERPE, ECOLI; PASMU, HAEIN; AROAE и SACD2 связаны лишь отдаленно в одной большой кладе; в остальном различия достаточно значительные.