Карань Анна
студентка факультета биоинженерии и бионформатики

Реконструкция филогении по РНК

Задание 1. Построение дерева по нуклеотидным последовательностям

Деревья строились на основе выравнивания последовательностей РНК малой субъединицы рибосомы (16S rRNA). Они были взяты из базы полных геномов NCBI ftp://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/. Взяты последовательности видов из 1-го практикума .
Получен файл последовательностей. По нему в программе Mega было построено выравнивание. Далее в Mega методом Neighbor-Joining было построено дерево (Рис.1.)

Рис.1. Здесь показаны деревья, построенные в Mega методом Neighbor-Joining. Слева - Original tree, справа - Bootstrap consensus tree

С первого раза может показататься, что деревья, изображенные на Рис.1. отличаются, но это не так. Bootstrap consensus tree - то же самое, что и Original tree, вот только внешне укорененное в ветвь STRPN. (Однако, если построить укоренение по STRPN дерево получается сильно не сбалансированным, что, конечно, не приветствуется.)
Так что пока сравним без учета укоренения ветви с правильным деревом. Единственное отличие от верного дерева - LACAC и STRPN не отделились в одну тривиальную ветвь.
Дерево получилось гораздо лучше, чем по белкам (в случае белков верной была только 1 ветвь), что логично, так как rRNA (особенно 16s) очень распространены для определения и дальних, и близких родственных связей из-за нераспространенности горизонтального переноса rRNA (такие случаи известны, вот недавно на конференции слушала про водоросль с гпг rRNA от малярийного плазмодия (статьи еще нет, ссылку привести не могу), это считается чем-то удивительным)

Задание 2. Построение и анализ дерева, содержащего паралоги

Таблица 1. Соответствие находки и мнемоники в выравнивании и дереве
МнемоникаНазвание белка (мнемоники видов как в прошлых практикумах)
STRPN_ClpxATP-dependent Clp protease ATP-binding subunit ClpX
BACAC_ClpxATP-dependent Clp protease ATP-binding subunit ClpX
LISMO_ClpxATP-dependent protease ATP-binding subunit ClpX
STAES_ClpxATP-dependent protease ATP-binding subunit ClpX
CLOBA_ClpxATP-dependent Clp protease ATP-binding subunit ClpX
FINM2_ClpxATP-dependent Clp protease ATP-binding subunit ClpX
LACAC_ClpxATP-dependent Clp protease ATP-binding subunit ClpX
CLOTE_ClpxATP-dependent Clp protease ATP-binding subunit ClpX
LACAC_HsluvHslU--HslV peptidase ATPase subunit
BACAC_HsluATP-dependent protease ATP-binding subunit HslU
STAES_HsluATP-dependent protease ATP-binding subunit HslU
LISMO_HsluATP-dependent protease ATPase subunit HslU
CLOBA_ClpbATP-dependent chaperone ClpB
STRPN_drdihydrofolate reductase
CLOTE_ClpcATP-dependent Clp protease ATP-binding subunit ClpC

В данном задании необходимо реконструировать дерево по достоверным гомологам белка "ATP-dependent Clp protease ATP-binding subunit ClpX OS=Bacillus subtilis". В Таблице 1 представлены выбранные гомологичные белки и сопоставленные им мнемоники, поиск гомологичных белков осуществлялся с помощью blastp на сайте NCBI с ограничениям по нужным организмам. Все находки с e-value значительно ниже 0,001
Далее все белки были выравнены программой Musle в Mega - выравнивание
Потом было построено дерево методом Neighbor-Joining.

Рис.2 Дерево, построенное в Mega. Цветными прямоугольниками выделены группы ортологов, и выделен пример паралогов.

На Рис.2 приведены примеры ортологов и паралогов. Красный прямоугольник последовательности субъединицы Clpx, зеленый - HslU, это судъединицы, выполняющие схожие функции в разных протеазах, так что они достаточно похоже. А паралоги - это гомологичные белка в одном организме, так что это паралоги - любые 2 последовательности из этих двух блоков из одной бактерии. Так же на Рис.2 показаны отраженные на дереве эволюционные события двух типов: 1) дупликация гена; 2) разделение путей эволюции белков в результате видообразования, на каждый тип по 2 примера.


©Карань Анна, 2015