Построение и анализ дерева, содержащего паралоги.Белки-гомологи - белки, имеющие общее происхождение.
1. Поиск гомологов.Поиск достоверных гомологов указанного белка вёлся среди протеомов перечисленных бактерий:
Перед началом работы все протеомы бактерий были скачены и собраны в единый файл proteomes.fasta. Последовательность белка, гомологи которого надо отыскать, была сохранена в файл CLPX_ECOLI.fasta. Затем из файла с протеомами была создана база данных для дальнейшего поиска гомологов.
Далее запускался сам поиск с помощью алгоритма BLASTP.
Из найденных белков я выбрала самые достоверные гомологи (основной критерий отбора - E-value). Аминокислотные последовательности этих белков собраны в файл chosen.fasta. Далее было построено выравнивание всех последовательностей.
| ||||||||||||||||||||
2. Построение дерева.Затем на основе полученного файла с выравниванием методом Минимальной эволюции (Minimum Evolution) было построено филогенетическое дерево.
Сиреневым пунктиром выделена клада, содержащая белки-ортологи CLPX и B9JD32. Все эти белки находятся в разных организмах, однако выполняют одинаковую функцию (ATP-dependent Clp protease ATP-binding subunit ClpX). Оранжевый пунктир соответствует группе белков-ортологов HSLU (ATP-dependent protease ATPase subunit HslU). Синими и зелеными рамками выделены пары паралогов - белков, имеющих общего предка и находящихся в организме одного вида, однако функционально разошедшихся в ходе эволюции. |
© Svetlana Kozyulina 2018