Для выполнения данного пункта я собрал все нужные мне протеомы в один файл с помощью команды cat. Далее я создал базу данных по этому файлу командой makeblastdb (с параметром -dbtype prot). Поиск гомологов был осущетвлен с помощью blastp с порогом e-value 0.001 (результат работы алгоритма).
Рис. 1. Филогенетическое дерево, построенное по алгоритму FastME с Bootstrap 100.Рис. 2. Филогенетическое дерево с выделением ортологических групп (зеленый цвет - субъединица комплекса, обеспечивающего формирование структуры Холлидея; синий - АТФ-связывающая субъединица протеосомподобного комплекса деградации HslU; красный - АТФ-связывающая субъединица Clp протеазы; фуксия - АТФ-зависимая цинковая металлпептидаза).Рис. 3. Филогенетическое дерево (те же ортологические группы, что и на Рис. 2, представлены в "схлопнутом" виде).
Обсуждение результатов
В красную группу попали все бактерии, и филогения данного белка соответствует филогении бактерий (см. практикум 1, Рис. 1). Аналогичная ситуация для розовой группы. В синей группе нет белка из POLAQ, но ветки не противоречат филогении бактерий. Зеленая группа состоит только из трех белков (из PASMU, BARHE, PARDP); противоречий в ветках с бактериальными деревом нет.