pano

Составление списка гомологичных белков, включающих паралоги

В данном практикуме нужно было осуществить поиск белков гомологичных CLPX_ECOLI (АТФ-связывающая субъединица ClpX протеазы Clp Escherichia coli) среди протеомов выбранных ранее бактерий.

Для начала был создан общий файл со всеми выбранными протеомами:

cat ARTS2.fasta CORDI.fasta MYCLE.fasta MYCTU.fasta NOCSJ.fasta RHOJR.fasta STRAW.fasta > proteomes.fasta

Далее blastp

makeblastdb -dbtype prot -in proteomes.fasta -out bac_db

blastp -query clpx_ecoli.fasta -num_threads 4 -db bac_db -evalue 0.001 -out blast_res.txt

Получено 19 находкок (файл с результатом ). Находки с наименьшим E-Value - АТФ-зависимые Clp протеазы всех бактерий (ATP-dependent Clp protease).

Реконструкция и визуализация

При помощи программы FastMe ("Gamma distributed rates across sites" — No, "Starting tree" — BIONJ, "No refinement", 100 бутстреп реплик) было реконструировано филогенетическое дерево найденных белков:

pano

Рис. 1 Реконструированное филогенетическое дерево гомологов CLPX_ECOLI

Исходя из дерева можно выделить пары паралогов:

  • Q0S6Y7_RHOJR и Q0S8C7_RHOJR;
  • A0JR82_ARTS2 и A0K236_ARTS2;
  • Q82QV8_STRAW и Q82EE9_STRAW.
  • Также можно выделить и пары ортологов:

  • Q0S8C7_RHOJR и Q6NFB1_CORDI
  • CLPX_STRAW и CLPX_ARTS2
  • A1SDV1_NOCSJ и Q82EE9_STRAW
  • pano

    Рис. 2 Филогенетическое дерево гомологов CLPX_ECOLI с выделенными ортологическими группами

    pano

    Рис. 3 Филогенетическое дерево с коллапсироваными ортологическими группами

    Также для удобства сравнения дерево из первого практикума ("эталонное"):

    pano

    Рис. 4 Дерево из первого практикума

    Обсудим?

    Жёлтым цветом обозначена группа АТФ-связывающих субъединиц протеаз Clp. Все эти белки встречаются по разу в каждой бактерии и имеют E-value "машииный" ноль. Ветвь несколько отличается от исходного дерева бактерий, но некритично: группа {MYCLE, MYCTU, RHOJR, CORDI} сохранила архитектуру, а взаиморасположение остальных трёх элементов "перепутано" (тут стоит сказать, что но бутстрэп поддержка этих ветвей очень низкая). Также можно заметить, что ветви сравнительно короткие, что может свидетелсьвтовать о быстрой эволюции и возможно неверном построении ветви.

    Что касается красной группы, то она отлично сопоставляется с "эталоном". Группа {ARTS2, NOCSJ, STRAW} отделяется от далёкой MYCTU и при этом сохраняет внутреннюю иерархию.