Учебный сайт Полины Байкузиной

Главная Семестры О себе Ссылки

Реконструкция филогении по нуклеотидным последовательностям. Паралоги.

Задание 1. Построение дерева по нуклеотидным последовательностям

В данном задании требовалось построить филогенетическое дерево бактерий, используя последовательности РНК малой субъединицы рибосомы (16S rRNA). Последовательности 16S рибосомальной РНК каждой из бактерий были получены из базы полных геномов NCBI ( ftp://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/), из файлов с расширением frn, которые содержат последовательности всех РНК.

Таблица 1. Выбранные представители бактерий
Название Мнемоника Штамм
Bradyrhizobium japonicum BRAJA Bradyrhizobium_japonicum_USDA_110_uid57599
Burkholderia cenocepacia BURCA Burkholderia_cenocepacia_AU_1054_uid58371
Ralstonia pickettii RALPJ Ralstonia_pickettii_12D_uid58859
Enterobacter sp. 638 ENT38 Enterobacter_638_uid58727
Escherichia coli ECOLI Escherichia_coli_042_uid161985
Yersinia pestis YERPE Yersinia_pestis_A1122_uid158119
Vibrio cholerae VIBCH Vibrio_cholerae_IEC224_uid89389
Proteus mirabilis PROMH Proteus_mirabilis_BB2000_uid214430

Полученные последовательности были выровнены методом Muscle. Далее в программе MEGA было реконструировано дерево методом Maximum Likelihood.

Рис.1. Филогенетическое дерево бактерий, построенное методом Maximum Likelihood с использованием последовательностей РНК малой субъединицы рибосомы (16S rRNA)

Полученное дерево совпадает с правильным (практикум 1).

Задание 2. Построение и анализ дерева, содержащего паралоги

В данном задании требовалось найти в выбранных бактериях гомологов белка CLPX_ECOLI. Для этого был проведен поиск программой blastp с E-value 0.001. Затем было получено выранивание последовательностей белков методом Muscle, и реконструировано дерево полученных гомологов методом Neighbor-Joining.

Рис.2. Результаты выдачи blastp

Белки, встретившиеся в выдаче blast:

  • CLPX - ATP-dependent Clp protease ATP-binding subunit ClpX;
  • HSLU - ATP-dependent protease ATPase subunit HslU;
  • Q9KU86, B4F2B3, FTSH, A4WEY9, A0A0H2XMS5, H7C810, B2UGP9 - ATP-dependent zinc metalloprotease FtsH;
  • Q74RB9 - Putative magnesium chelatase family protein;
  • RUVB - Holliday junction ATP-dependent DNA helicase RuvB;
  • Q0WBE7 - Cell division protein.
Рис.3. Дерево гомологов

Паралогами называются два гомологичных белка из одного организма (красным выделены все гомологи Proteus mirabilis, которые попарно являются паралогами; аналогично зеленым цветом выделены все гомологи Escherichia coli и голубым - гомологи Burkholderia cenocepacia).

Ортологи - два гомологичных белка из разных организмов, и разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования. На рис.3 синим и оранжевым цветами выделены группы попарно ортологичных белков.

Также на дереве отражены эволюционные события:

  • дупликация гена на примере белков CLPX и HSLU;
  • разделение путей эволюции белков в результате видообразования: дуплицировавшийся ген стал выполнять функцию хеликазы RuvB у альфа-протеобактерий; у энтеробактерий ген стал выполнять функцию магниевой хелатазы (Q74RB9).

© Полина Байкузина, 2016