Построение и анализ дерева, содержащего паралоги.

Белки-гомологи - белки, имеющие общее происхождение.
Ортологи - белки, которые разошлись в результате видообразования. Таким образом, белки-ортологи находятся в организмах разных видов и, как правило, выполняют схожие функции.
Паралоги - белки, образовавшиеся в результате дупликации генов. Следовательно, такие белки существуют в одном организме и эволюционируют почти независимо друг от друга, а значит, могут сильно различаться в функциях.

1. Поиск гомологов.

Поиск достоверных гомологов указанного белка вёлся среди протеомов перечисленных бактерий:

Название Мнемоника
Agrobacterium tumifaciens AGRRK
Burkholderia cenocepacia BURCA
Ralstonia solanacearum RALSO
Escherichia coli ECOLI
Salmonella typhimurium SALTY
Yersinia pestis YERPE
Vibrio fischeri VIBFM
Haemophilus influenzae HAEIN
Pasteurella multocida PASMU

Перед началом работы все протеомы бактерий были скачены и собраны в единый файл proteomes.fasta. Последовательность белка, гомологи которого надо отыскать, была сохранена в файл CLPX_ECOLI.fasta.

Затем из файла с протеомами была создана база данных для дальнейшего поиска гомологов.
Командная строка: makeblastdb -in proteomes.fasta -dbtype prot

Далее запускался сам поиск с помощью алгоритма BLASTP.
Командная строка: blastp -query CLPX_ECOLI.fasta -db proteomes.fasta -evalue 0.001 -out blast.out -outfmt 7 -num_alignments 50

Из найденных белков я выбрала самые достоверные гомологи (основной критерий отбора - E-value). Аминокислотные последовательности этих белков собраны в файл chosen.fasta.

Далее было построено выравнивание всех последовательностей.
Командная строка: muscle -in chosen.fasta -out align.fasta

2. Построение дерева.

Затем на основе полученного файла с выравниванием методом Минимальной эволюции (Minimum Evolution) было построено филогенетическое дерево.


Рис.1. Филогенетическое дерево.

Сиреневым пунктиром выделена клада, содержащая белки-ортологи CLPX и B9JD32. Все эти белки находятся в разных организмах, однако выполняют одинаковую функцию (ATP-dependent Clp protease ATP-binding subunit ClpX). Оранжевый пунктир соответствует группе белков-ортологов HSLU (ATP-dependent protease ATPase subunit HslU). Синими и зелеными рамками выделены пары паралогов - белков, имеющих общего предка и находящихся в организме одного вида, однако функционально разошедшихся в ходе эволюции.


© Svetlana Kozyulina 2018