Практикум 4

Задание 1

Составление списка гомологичных белков, включающих паралоги

Для получения протеомов моих бактерий и гомологичных белков из них я воспользовался следующими командами:

cp /P/y21/term4/Proteomes/'мнемоника'.fasta ~/public_html/term4/pr4

cat *.fasta >> proteomes.fasta

makeblastdb -dbtype prot -in proteomes.fasta

blastp -query P0A6H1.fasta -outfmt 7 -db proteomes.fasta -evalue 0.001 >> out.txt

В результате были получены файл proteomes.fasta со всеми протеомами и файл out.txt — список 23 находок гомологов белка CLPX_ECOLI.

Задание 2

Реконструкция и визуализация

Отредактированный файл с последовальностями находок и их id: findings.fasta.

Посредством программы FastME на платформе NGPhylogeny.fr была произведена реконструкция дерева найденных белков. Указанные параметры: "Gamma distributed rates across sites" — No (без моделирования скорости замен в различных сайтах); "Starting tree" — BIONJ (алгоритм построения дерева BIONJ); "No refinement" (без уточнения дерева); 100 бутстреп-реплик. Файл с Newick-формулой дерева: Output_Tree.nhx.

Рис.1. Реконструированное дерево с тремя ортологическими группами разных цветов. Дерево укоренено в среднюю точку; указаны числа бутстреп-поддержки.

Таблица пар белков-ортологов и паралогов:

Ортологи Паралоги
Q0S8C7 RHOJR и Q6NFB1 CORDI Q0S6Y7 RHOJR и Q0S8C7 RHOJR
Q6ACQ0 LEIXX и B0RHW4 CLAMS A0LW31 ACIC1 и CLPX ACIC1
CLPX STRAW и CLPX ACIC1 RUVB BIFLO и Q8G871 BIFLO

Рис.2. Реконструированное дерево со "схлопнутыми" ортологическими группами разных цветов.

Характеристики групп:

  1. Красная группа: представлена только четырьмя видами, которые на эталонном дереве находятся достаточно далеко друг от друга. В эту группу входят АТФ-зависимые протеазы Clp семейства ААА-белков.
  2. Сиреневая группа: представлена шестью видами. Реконструкция дерева похожа на эталонную, с учётом поддержки ветвей. В эту группу попали АТФ-зависимые цинковые металлопротеазы FtsH.
  3. Оранжевая группа: представлена всеми 8 видами бактерий. Значения бутстреп-поддержки в целом высокие, однако реконструированная филогения не похожа на эталонную. Все белки имеют одинаковую мнемонику CLPX (ATP-dependent Clp protease ATP-binding subunit ClpX) и относятся к АТФ-зависимым протеазам Clp.