Реконструкция филогении по нуклеотидным последовательностям. Паралоги.

Реконструкция филогении по нуклеотидным последовательностям

Для заданных бактерий (см. предыдущий практикум) с сайта базы полных геномов NCBI были взяты последовательности 16S рРНК. Последовательности брались для случайных штаммов каждого вида.

Затем с помощью онлайн-сервиса Jalview было получено выравнивание этих последовательностей программой maft со стандартными параметрами. По полученному выравниванию было реконструировано дерево в программе MEGA методом Neighbor-Joining using % identity. Полученное дерево показано на рис.1.


Рис.1. Изображение дерева.

Это дерево содержит в себе следующие ошибки по сравнению с эталонным:

В эталонном дереве нет ветви (GEOKA,LISMO,ENTFA) против (CLOTE,FINM2,LACDA,LACAC,LACLM)

В эталонном дереве нет ветви (LACDA,LACAC,LACLM) против (CLOTE,FINM2,GEOKA,LISMO,ENTFA)

В эталонном дереве нет ветви (LISMO,ENTFA) против (CLOTE,FINM2,GEOKA,LACDA,LACAC,LACLM)

В эталонном дереве есть ветвь (ENTFA,LACLM) против (GEOKA,LISMO,CLOTE,FINM2,LACDA,LACAC)

В эталонном дереве есть ветвь (ENTFA,LACLM,LACDA,LACAC) против (GEOKA,LISMO,CLOTE,FINM2)

Таким образом, в построенном дереве неверно определно положение организма ENTFA (если переставить тривиальную ветвь с ENTFA, дерево станет идентичным эталонному).

От дерева, построенного тем же методом по последовательности Шаперонина (см. предыдущий практикум), данное дерево отличается также положением организма ENTFA (вместо ветви (LISMO,ENTFA) против (CLOTE,FINM2,GEOKA,LACDA,LACAC,LACLM) у белков есть ветвь (LISMO,GEOKA) против (CLOTE,FINM2,ENTFA,LACDA,LACAC,LACLM), остальные идентичны).

Построение и анализ дерева, содержащего паралоги

Чтобы найти гомологов в заданных организмах, использовались файламы, содержащие скачанные из Uniprot полные протеомы бактерий, перечисленных в таблице предыдущего практикума. Был проведен поиск программой blastp гомологов (с порогом на E-value 0,001) по протеомам отобранных бактерий. Геномы нужных бактерий были слиты в один файл - all.fasta, была создана база типа prot и проведен бласт:

blastp -query CLPX_BACSU.fasta -db all.fasta -evalue 0.001 -outfmt 7 -word_size 3 -out homologus

Из полученной таблицы были взяты ID найденных гомологов, с помощью команды seqret были полученны последовательности этих белков. Выравнивание производилось с помощью сервиса Jalview методом muscle. На рис.2. показано дерево, полученное методом Neighbor-Joining using % identity в программе MEGA.


Рис.2. Изображение дерева.

На полученном дереве найдены примеры ортологов (разделение путей эволюции белков в результате видообразования) и парологов (дупликация гена с последующей эволюцией). Парологи показаны на рис.3,4. Ортологи показаны на рис.5,6.


Рис.3. Парологи: Q899V4 и Q898C7; BOS3X9 и BOS3JO

Рис.4. Парологи: Q891B9 и Q899H3

Рис.5. Группа ортологов

Рис.6. Группа ортологов
© Маслова Валентина, 2014
Последнее изменение: 24.09.2014