Построение и анализ дерева, содержащего паралоги


1. Поиск гомологов

В этом задании необходимо было Найти в своих бактериях достоверные гомологи белка CLPX_ECOLI, затем реконструируировать дерево этих гомологов, проанализировать его. Для выполнения задания для каждой из бактерий в таблице ниже был найден протеом.
Название Мнемоника
Agrobacterium tumifaciens AGRRK
Rhizobium etli RHIEC
Ralstonia solanacearum RALSO
Burkholderia cenocepacia BURCA
Escherichia coli ECOLI
Yersinia pestis YERPE
Yersinia pseudotuberculosis YERPS
Haemophilus influenzae HAEIN

Протеомы всех бактерий были объединены в один файл для упрощения поиска гомологов в BLAST. Ссылка на fasta-файл со всеми протеомами: proteoms.fasta. Ссылка на аминокислотную последовательность белка CLPX_ECOLI: CLPX.fasta. Для поиска гомологов из файла с протеомами необходимо было сделать базу данных:
>makeblastdb -in proteoms.fasta -dbtype prot

Для поиска гомологов была выполнена следующая команда:
>blastp -query CLPX.fasta -db proteoms.fasta -evalue 0.001 -out blast.out -outfmt 7 -num_alignments 50

Выдача программы BLASTp: blast.out. Было найдено 36 гомологичных белков. Для построения дерева я выбрала белки, для котроых длина выравнивания с референсом составляет существенную часть их общей длины (примерно половина и больше). Списк белков: protein_list. С помощью Uniprot был получен файл с аминокислотными последовательностями отобранных белков: selected2.fasta

После этого полседовательности были выровнены программой muscle:
>muscle -in selected2.fasta -out selected_a2.fasta

2. Поcтроение дерева

На основании полученного выравниваения было построено филогенетическое дерево с помощью программы Mega методом Minimum evolution. Результат представлен на рисунке ниже. На дереве можно увидеть белки-ортологи и белки-паралоги.
Паралоги - гомологичные белки из одного организма (пример подчеркнут красным).
Ортологи - гомологичные белки из разных организмов, разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования) (зелёные рамки).


Рис.1 Филогенетическое дерево ортологов и паралогов
Назад