Реконструкция деревьев по нуклеотидным последовательностям.
Деревья, содержащие паралоги.

Построение дерева по нуклеотидным последовательностям

В данном задании мы строим филогенетическое дерево бактерий, с которыми работали и в прошлых двух практикумах, но с использованием методов, использующих в качестве входных данных нуклеотидные последовательности. К таким методам относятся Neighbor-Joining, Minimum evolution, Maximum likelihood. В качестве последовательности используем 16S РНК бактерий.

В таблице 1 для каждой из рассматриваемых бактерий приведены: AC записи EMBL, в которой обнаружена последовательность 16S rRNA, координаты этой РНК в этой записи, а также то, на прямой или обратной цепи она расположена.

Таблица 1. Информация о полученных записях, содержащих последовательность 16S РНК
Бактерия Мнемоника AC записи EMBL Координаты Цепь
Bacillus anthracis BACAN CP002183 9750..11308 Прямая
Clostridium botulinum CLOB1 CP000726.1 48468..49969 Прямая
Enterococcus faecalis ENTFA AE016830 248466..249987 Прямая
Geobacillus kaustophilus GEOKA BA000043.1 10421..11973 Прямая
Lactobacillus delbrueckii LACDA CP002341.1 33581..35141 Прямая
Listeria monocytogenes LISMO CP007492.1 242732..244284 Прямая
Streptococcus pneumoniae STRPN CP006844.1 1696703..1698247 Обратная

Все полученные последовательности 16S РНК были помещены в файл: FASTA и переименованы в соответствии с мнемоникой конкретного вида. Затем последовательности были выравнены программой Muscle (использовался web-интерфейс). Выравнивание было импортировано в программу MEGA, в которой было построено филогенетическое дерево методом Neighbour joining. На рисунке 1 представлено сравнение правильного дерева и построенного по последовательности 16S РНК.

Рисунок 1. Правильное дерево (слева) и дерево, построенное методом Neighbour joining по последовательностям 16S РНК (справа).

Реконструированное дерево с правильным не совпадает. Из четырёх ветвей, присутствующих в правильном дереве, две присутствуют и в реконструированном по нуклеотидным последовательностям. Отсутствуют следующие ветви: {BACAN,LISMO,GEOKA}&{others} и {LACDA,ENTFA,STRPN}&{others}.

Вообще-то, исходя из того, что в нуклеотидных последовательностях всего четыре различных элемента алфавита (против 20 в белковых последовательностях), можно предположить, что основанные на них филогенетические деревья будут хуже реконструировать реальность. Это связано с большей вероятностью неправильного выравнивания, а также с тем, что в таких выравниваниях будут учитываться случайные молчащие мутации, которые никак не влияют на последовательность белка.

Построение и анализ дерева, содержащего паралоги

Сначала приведу определения:

Паралоги - последовательности, к разделению которых привело удвоение гена внутри одного организма (в результате хромосомной мутации). В качестве примера паралогов приводятся, например, гены различных форм гемоглобина человека (α, β, γ и др.).
Ортологи - последовательности, к разделению которых привел акт видообразования. Примером ортологичных генов могут быть гены гемоглобина β у человека и лемура.

В данном разделе мы найдем гомологи белка CLPX_BACSU (ATP-dependent Clp protease) в рассматриваемых бактериях. На дереве, построенном по таким гомологам, попробуем указать на два типа эволюционных событий: 1) дупликацию гена; 2) разделение путей эволюции белков в результате видообразования.

С помощью команды blastp (порог E-value 0,001) среди всех белков всех бактерий, упомянутых в первом практикуме, были найдены гомологи, а затем отобраны те, которые относятся к рассматриваемому списку из семи бактерий. полная выдача blastp: Out_blast. Далее были отобраны те, которые относятся к нашим семи бактериям: Out_select. Для 31 белка были получены последовательности в fasta-формате: Protein_seq.

Все полученные последовательности были выравнены с помощью программы Muscle, затем построено дерево гомологов методом Neighbour joining.
Рисунок 2. Дерево, построенное по последовательностям гомологов белка CLPX_BACSU из семи рассматриваемых бактерий. Квадратной скобкой выделен пример ветви дерева, состоящей из белков-ортологов.

Пример ортологов: CLPX_LISMO, CLPX_BACAN, CLPX_LACDA, CLPX_CLOB1, CLPX_GEOKA, CLPX_ENTFA и CLPX_STRPN (показаны на рисунке 2 скобкой).
Пример паралогов: B1SHF4_BACAN и B0AWL5_BACAN (образовались в результате дупликации гена).

В качестве примера разделения белков в результате видообразования: разделение на ветвь, содержащую CLPX_X, и ветвь с белками HSLU_X (точка дивергенции обозначена на рисунке красным квадратиком).

Дата последнего обновления: 17.05.2014
© Dmitry Travin, 2014