Практикум 4.

Составление списка гомологичных последовательностей.

Для выполнения данного пункта я собрал все нужные мне протеомы в один файл с помощью команды  cat. Далее я создал базу данных по этому файлу командой makeblastdb (с параметром -dbtype prot). Поиск гомологов был осущетвлен с помощью blastp с порогом e-value 0.001 (результат работы алгоритма).

  1. список находок из выдачи BLAST
  2. Последовательности, скаченные из Uniprot, с отредактированными названиями

Построение дерева

Результат работы алгортма (формула дерева).

Паралоги:

  1. RUVB PARDP, A1BBJ2 PARDP
  2. A1AY35 PARDP, A1B8N4 PARDP
  3. RUVB BARHE, A0A0H3LXZ4

Ортологи:

  1. CLPX PASMU, CLPX HAEIN
  2. HSLU PARDP, HSLU BARHE
  3. RUVB PARDP, RUVB BARHE
Рис. 1. Филогенетическое дерево, построенное по алгоритму FastME с Bootstrap 100.
Рис. 2. Филогенетическое дерево с выделением ортологических групп (зеленый цвет - субъединица комплекса, обеспечивающего формирование структуры Холлидея; синий - АТФ-связывающая субъединица протеосомподобного комплекса деградации HslU; красный - АТФ-связывающая субъединица Clp протеазы; фуксия - АТФ-зависимая цинковая металлпептидаза).
Рис. 3. Филогенетическое дерево (те же ортологические группы, что и на Рис. 2, представлены в "схлопнутом" виде).

Обсуждение результатов

В красную группу попали все бактерии, и филогения данного белка соответствует филогении бактерий (см. практикум 1, Рис. 1). Аналогичная ситуация для розовой группы. В синей группе нет белка из POLAQ, но ветки не противоречат филогении бактерий. Зеленая группа состоит только из трех белков (из PASMU, BARHE, PARDP); противоречий в ветках с бактериальными деревом нет.