учебная страничка Маши Смирновой

реконструкция дерева по нуклеотидным последовательностям 12s rrna

введение

для реконструкции дерева по нуклеотидным последовательностям были использованы последовательности гена 12s rrna митохондриальной днк выбранных китообразных. полные митохондриальные геномы соответствующих видов были получены из базы ena, координаты гена 12s rrna определены по аннотации в embl‑записях, после чего соответствующие фрагменты были извлечены с помощью программы seqret (например, командами вида seqret embl:accession[start:end] name_12s_rrna.fasta). полученные последовательности были объединены в общий файл и выровнены программой muscle, а по выравниванию cetacea_12s_aln.phy было построено дерево в программе iq‑tree, результирующее дерево записано в файле cetacea_12s_aln.phy.treefile.

1. рисунок iq‑tree без аутгруппы

дерево iq‑tree без внешней группы

филогенетическое дерево iq-tree без аутгруппы
рис. 1. филогенетическое дерево, построенное программой iq‑tree по выравниванию нуклеотидных последовательностей гена 12s rrna китообразных (`cetacea_12s_aln.phy.treefile`)

на этом неукоренённом дереве видны компактные клады близких последовательностей (например, группа mf409242–mf409243–mf409247 и кластеры последовательностей с accession aj554055/aj277029 и px427675/aj554063), однако строгое направление эволюции интерпретировать нельзя, так как внешняя группа ещё не добавлена.

2. укоренение во внешнюю группу (sus scrofa)

iq‑tree с sus scrofa как аутгруппой

дерево iq-tree с sus scrofa как аутгруппой
рис. 2. то же дерево по 12s rrna, построенное программой iq‑tree по выравниванию `cetacea_12s_plus_suss_aln.phy`, включающему последовательность sus scrofa (aj002189), с укоренением по ветви, ведущей к свинье; киты образуют сестринскую к аутгруппе кладу.

младший общий таксон всех исходно выбранных видов — подотряд whippomorpha, объединяющий китообразных и их ближайших наземных родственников, гиппопотамов. в качестве внешней группы для укоренения дерева по 12s rrna был выбран вид sus scrofa (домашняя свинья), принадлежащий к отряду artiodactyla, но не входящий в подотряд whippomorpha. из митохондриального генома sus scrofa (accession aj002189) по координатам 71..1032 в записи ft была извлечена последовательность 12s rrna командой seqret embl:aj002189[71:1032] suss_12s_rrna.fasta, после чего она была добавлена к набору китообразных, выровнена вместе с ними, и по выравниванию cetacea_12s_plus_suss_aln.phy было построено ml‑дерево в программе iq‑tree (файл cetacea_12s_plus_suss_aln.phy.treefile).

полученное дерево, включающее последовательность aj002189 (sus scrofa), описывается скобочной формулой:

(aj554063:0.0089,((((aj554055:0.0747,aj277029:0.0682):0.0346,(mf409247:0.0509,(mf409242:0.0303,mf409243:0.0283):0.0137):0.0386):0.0135,aj002189:0.3147):0.0858,((kf164610:0.0200,(mf669496:0.0039,eu557093:0.0063):0.0100):0.0079,eu557095:0.0141):0.0056):0.0368,px427675:0.0383);

при укоренении этого дерева по ветви, ведущей к sus scrofa (aj002189), последовательность свиньи образует отдельную внешнюю ветвь, а все последовательности китообразных формируют сестринскую к ней кладу; при этом крупные кластеры внутри китообразных, соответствующие группам mf409242–mf409243–mf409247 и парам aj554055–aj277029, px427675–aj554063, сохраняют своё взаимное расположение, то есть добавление аутгруппы не приводит к радикальной перестройке топологии внутри основной группы видов.

3. бутстрэп‑оценка дерева по 12s rrna (fastme)

fastme с бутстрэпом

дерево fastme с бутстрэп-оценкой
рис. 3. филогенетическое дерево, построенное программой fastme по выравниванию `cetacea_12s_plus_suss_aln.phy` методом расстояний с 100 бутстрэп‑репликами (`cetacea_12s_plus_suss_fastme_boot.nwk`); на внутренних ветвях показаны значения бутстрэп‑поддержки, отражающие надёжность соответствующих клад.

для оценки надёжности реконструкции дерева по 12s rrna было использовано выравнивание cetacea_12s_plus_suss_aln.fasta, включающее последовательности китообразных и внешней группы sus scrofa. выравнивание было конвертировано из формата fasta в формат phylip‑relaxed с помощью небольшого скрипта на python и библиотеки biopython (alignio), после чего по файлу cetacea_12s_plus_suss_aln.phy было построено дерево в программе fastme с использованием 100 реплик бутстрэпа (опции -d для входного выравнивания и -b 100 для числа бутстрэп‑реплик); итоговое консенсус‑дерево с бутстрэп‑поддержкой внутренних ветвей записано в файле cetacea_12s_plus_suss_fastme_boot.nwk.

структура полученного fastme‑дерева описывается формулой:

((kf164610:0.0180,(((px427675:0.0276,aj554063:0.0142)99:0.0162,((((mf409243:0.0259,mf409242:0.0248)96:0.0093,mf409247:0.0396)100:0.0235,(aj277029:0.0477,aj554055:0.0558)100:0.0175)70:0.0068,aj002189:0.1162)100:0.0393)98:0.0107,eu557095:0.0149)78:0.0042)98:0.0085,mf669496:0.0038,eu557093:0.0056);

здесь численные значения возле внутренних узлов отражают бутстрэп‑поддержку соответствующих клад: например, клады mf409242–mf409243 - 96 , mf409242–mf409243–mf409247 - 100 и пары aj277029–aj554055 - 100 хорошо поддержаны, тогда как объединение этих крупных подклад с последовательностью sus scrofa (aj002189) имеет более умеренную поддержку 70, а ветвь, объединяющая кладу px427675–aj554063 с остальной частью дерева, поддержана на уровне 98.

в целом для данного набора последовательностей 12s rrna наблюдается ожидаемая картина: крупные клады, соответствующие близкородственным группам последовательностей (например, mf409242–mf409243–mf409247 или парам aj277029–aj554055 и px427675–aj554063), обладают высокой бутстрэп‑поддержкой, что говорит о их устойчивости к ресэмплингу по сайтам, тогда как более глубокие или потенциально спорные разветвления, включающие объединение отдалённой аутгруппы sus scrofa с основными кладами китообразных, могут иметь несколько более низкие значения поддержки. это соответствует теоретическим ожиданиям, согласно которым неправильно или нестабильно реконструируемые ветви чаще характеризуются пониженной бутстрэп‑поддержкой, тогда как клады, хорошо отражающие истинную филогенетическую структуру выборки, воспроизводятся в большинстве бутстрэп‑реплик.