Филогенетическое дерево, Реконструкция филогении, Сравнение деревьев, укоренение, бутстреп


НазваниеМнемоникаТаксономическое положение
Streptococcus pyogenes serotype M1STRP1 cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Streptococcus; Streptococcus pyogenes
Streptococcus pneumoniae serotype 4STRPNcellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Streptococcus
Lactococcus lactis subsp. cremorisLACLMcellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Lactococcus
Lactobacillus acidophilusLACACcellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
Lactobacillus delbrueckii subsp. bulgaricusLACDAcellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
Enterococcus faecalisENTFAcellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Enterococcaceae; Enterococcus
Staphylococcus aureusSTAARcellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus
Staphylococcus epidermidisSTAEScellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus

Таксономическое положение получено с сервиса NCBI. Все бактерии имеют общую таксономию cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli до уровня класса включительно. Более наглядно их систематическое положение отражено на дереве.

Скобочная формула дерева

Записана в файл 4-1.tre.


Изображение дерева

Если установить программу MEGA, а потом 2 раза щёлкнуть на файл 4-1.tre, открывается изображение дерева.

Рисунок 1. Филогенетическое дерево, построенное программой MEGA 7.0 (Older version)

Нетривиальные ветви дерева

Мы называем ветвь нетривиальной, если она разбивает множество листьев на подмножества, в каждом из которых более одного элемента. Есть 4 нетривиальных разбиения этого дерева:



   +     +     -     -     -     -     -     -
   +     +     +     -     -     -     -     -
   +     +     +     +     +     -     -     -
   +     +     +     +     +     +     -     -

Выравнивание последовательностей фактора элонгации трансляции Ts (EFTS)

По инструкции на kodomo: "Запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой идентификаторы белков — выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов (в нашем случае efts_strp1; efts_strpn; efts_laclm; efts_lacac; efts_lacda; efts_entfa; efts_staar; efts_staes; ). После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle)". Было получено выравнивание, сохранённое в формате fasta. Далее в Jalview были изменены названия и оставлены только мнемоники видов, название белка из описания тоже удалено, выравнивание сохранено в файле снова в формате fasta.

Построение филогенетических деревьев исходя из выравнивания последотельностей фактора элонгации трансляции Ts (EFTS)

Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку белков), далее разными способами построены деревья (Analysis -> Phylogeny -> ...).

Рисунок 2. Molecular Phylogenetic analysis by Maximum Likelihood method .nwk
Рисунок 3. Evolutionary relationships of taxa .nwk
Рисунок 4. Evolutionary relationships of taxa .nwk
Рисунок 5. Evolutionary relationships of taxa .nwk
Рисунок 6. Maximum Parsimony analysis of taxa .nwk

Укоренение с использованием внешней группы

По инструкции на kodomo: "Запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой идентификаторы белков — выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов (в нашем случае efts_strp1; efts_strpn; efts_laclm; efts_lacac; efts_lacda; efts_entfa; efts_staar; efts_staes; efts_ecoli;). После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle)". Было получено выравнивание, сохранённое в формате fasta. Далее в Jalview были изменены названия и оставлены только мнемоники видов, название белка из описания тоже удалено, выравнивание сохранено в файле снова в формате fasta.

Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку белков), далее методом максимальной экономии ("Maximum parsimony") построено дерево (Analysis -> Phylogeny -> ...) и сохранено в png (Рис. 7) и nwk.

Рисунок 7. Maximum Parsimony analysis of taxa (+ E.coli) .nwk

По инструкции с kodomo: "После реконструкции дерева нужно в меню Subtree выбрать Root и указать в качестве корня ветвь, ведущую к ECOLI" получено дерево (Рис. 8).

Рисунок 8. Maximum Parsimony analysis of taxa (+ E.coli-root)

Далее по инструкции с kodomo: "чтобы получить изображение укоренённого дерева без ECOLI, нужно воспользовавться кнопкой "Show Subtree Separately" (изображение голубой лупы на фоне дерева на левой панели окна MEGA)" получено изображение (Рис. 9).

Рисунок 9. Maximum Parsimony analysis of taxa (+ E.coli-root), изображение укоренённого дерева без ECOLI.nwk


"При бутстрэп-анализе (bootstrap — «петля на заднике ботинка») из исходного выравнивания в результате случайного удаления половины столбцов и заменой их копиями других (тоже случайно выбранных) столбцов создается бутстрэп-реплика. Создается их много (100-500). Далее для каждой реплики строится дерево, а из них по методу расширенного большинства (сначала строится дерево из ветвей, встретившихся в большинстве исходных деревьев, а потом к нему добавляются ветви, не противоречащие уже имеющимся) строится т.н. консенсусное дерево. При этом длины ветвей теряются, а ветви подписываются бутстрэп-поддержкой — процентом деревьев, в которых встретилась данная ветвь (нетривиальная)."

Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку белков), далее методом Neighbor-Joining построено дерево (Analysis -> Phylogeny -> Neighbor-Joining, при этом в окошке надо было выбрано est of Phylogeny - Bootstrap method, число реплик 100) и сохранено в png и nwk.

Рисунок 10. .nwk для bootstrap Эталонное дерево по систематическому положению & Дерево, построенное Neighbor-Joining method (original) & Дерево, построенное Neighbor-Joining method с помощью бутстрэп-анализа (consensus)


В списке по ссылке ftp://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/ был найден all.frn.tar.gz, в котором лежит информация по разным штаммов разных бактерий. Из fastа файлов вырезаны последовательности 16S рРНК и положены в файл 16S.fasta с заменой длинных названий на мнемоники видов. В Jalview File -> Input alignment -> Выбор 16.fasta. Далее выравнивание с помощью Muscle (Web Service -> Alignment -> ...). Выравнивание сохранено в файл 16Salign.fa. Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку нуклеотидов), далее разными способами построены деревья (Analysis -> Phylogeny -> ...).