Семестр 4, практикумы 1, 2, 3

Назад на учебную страницу Птицыной Елены

Филогенетическое дерево, Реконструкция филогении, Сравнение деревьев, укоренение, бутстреп

Бактерии

Название	Мнемоника	Таксономическое положение
Streptococcus pyogenes serotype M1	STRP1	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Streptococcus; Streptococcus pyogenes
Streptococcus pneumoniae serotype 4	STRPN	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Streptococcus
Lactococcus lactis subsp. cremoris	LACLM	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Lactococcus
Lactobacillus acidophilus	LACAC	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
Lactobacillus delbrueckii subsp. bulgaricus	LACDA	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
Enterococcus faecalis	ENTFA	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Lactobacillales; Enterococcaceae; Enterococcus
Staphylococcus aureus	STAAR	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus
Staphylococcus epidermidis	STAES	cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus

Таксономическое положение получено с сервиса NCBI. Все бактерии имеют общую таксономию cellular organisms; Bacteria; Terrabacteria group; Firmicutes; Bacilli до уровня класса включительно. Более наглядно их систематическое положение отражено на дереве.

Скобочная формула дерева

Записана в файл 4-1.tre.

(((((STRP1,STRPN),LACLM),(LACAC,LACDA)),ENTFA),(STAAR,STAES));

Изображение дерева

Если установить программу MEGA, а потом 2 раза щёлкнуть на файл 4-1.tre, открывается изображение дерева.

Нетривиальные ветви дерева

Мы называем ветвь нетривиальной, если она разбивает множество листьев на подмножества, в каждом из которых более одного элемента. Есть 4 нетривиальных разбиения этого дерева:

{STRP1, STRPN} против {LACLM, LACAC, LACDA, ENTFA, STAAR, STAES}
{STRP1, STRPN, LACLM} против {LACAC, LACDA, ENTFA, STAAR, STAES}
{STRP1, STRPN, LACLM, LACAC, LACDA} против {ENTFA, STAAR, STAES}
{STRP1, STRPN, LACLM, LACAC, LACDA, ENTFA} против {STAAR, STAES}

Таблица:

STRP1 STRPN LACLM LACAC LACDA ENTFA STAAR STAES
   +     +     -     -     -     -     -     -
   +     +     +     -     -     -     -     -
   +     +     +     +     +     -     -     -
   +     +     +     +     +     +     -     -

Выравнивание последовательностей фактора элонгации трансляции Ts (EFTS)

По инструкции на kodomo: "Запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой идентификаторы белков — выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов (в нашем случае efts_strp1; efts_strpn; efts_laclm; efts_lacac; efts_lacda; efts_entfa; efts_staar; efts_staes; ). После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle)". Было получено выравнивание, сохранённое в формате fasta. Далее в Jalview были изменены названия и оставлены только мнемоники видов, название белка из описания тоже удалено, выравнивание сохранено в файле снова в формате fasta.

Построение филогенетических деревьев исходя из выравнивания последотельностей фактора элонгации трансляции Ts (EFTS)

Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку белков), далее разными способами построены деревья (Analysis -> Phylogeny -> ...).

Рисунок 3. Evolutionary relationships of taxa .nwk The evolutionary history was inferred using the Neighbor-Joining method [1]. The optimal tree with the sum of branch length = 1.46595275 is shown. The tree is drawn to scale, with branch lengths in the same units as those of the evolutionary distances used to infer the phylogenetic tree. The evolutionary distances were computed using the Poisson correction method [2] and are in the units of the number of amino acid substitutions per site. The analysis involved 8 amino acid sequences. All positions containing gaps and missing data were eliminated. There were a total of 289 positions in the final dataset. Evolutionary analyses were conducted in MEGA7 [3]. 1. Saitou N. and Nei M. (1987). The neighbor-joining method: A new method for reconstructing phylogenetic trees. Molecular Biology and Evolution 4:406-425. 2. Zuckerkandl E. and Pauling L. (1965). Evolutionary divergence and convergence in proteins. Edited in Evolving Genes and Proteins by V. Bryson and H.J. Vogel, pp. 97-166. Academic Press, New York. 3. Kumar S., Stecher G., and Tamura K. (2016). MEGA7: Molecular Evolutionary Genetics Analysis version 7.0 for bigger datasets.Molecular Biology and Evolution 33:1870-1874.

Укоренение с использованием внешней группы

По инструкции на kodomo: "Запустите JalView. В меню File выберите Fetch sequences. Щёлкните по "Select Database" и выберите Uniprot. Запишите через точку с запятой идентификаторы белков — выражения вида xxxx_yyyyy, где xxxx – выбранная вами мнемоника функции, а yyyyy – мнемоники отобранных вами организмов (в нашем случае efts_strp1; efts_strpn; efts_laclm; efts_lacac; efts_lacda; efts_entfa; efts_staar; efts_staes; efts_ecoli;). После нажатия OK должно появиться окно с последовательностями. В этом окне выберите Web Service → Alignment → любая программа (например Muscle)". Было получено выравнивание, сохранённое в формате fasta. Далее в Jalview были изменены названия и оставлены только мнемоники видов, название белка из описания тоже удалено, выравнивание сохранено в файле снова в формате fasta.

Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку белков), далее методом максимальной экономии ("Maximum parsimony") построено дерево (Analysis -> Phylogeny -> ...) и сохранено в png (Рис. 7) и nwk.

По инструкции с kodomo: "После реконструкции дерева нужно в меню Subtree выбрать Root и указать в качестве корня ветвь, ведущую к ECOLI" получено дерево (Рис. 8).

Далее по инструкции с kodomo: "чтобы получить изображение укоренённого дерева без ECOLI, нужно воспользовавться кнопкой "Show Subtree Separately" (изображение голубой лупы на фоне дерева на левой панели окна MEGA)" получено изображение (Рис. 9).

Бутстрэп

"При бутстрэп-анализе (bootstrap — «петля на заднике ботинка») из исходного выравнивания в результате случайного удаления половины столбцов и заменой их копиями других (тоже случайно выбранных) столбцов создается бутстрэп-реплика. Создается их много (100-500). Далее для каждой реплики строится дерево, а из них по методу расширенного большинства (сначала строится дерево из ветвей, встретившихся в большинстве исходных деревьев, а потом к нему добавляются ветви, не противоречащие уже имеющимся) строится т.н. консенсусное дерево. При этом длины ветвей теряются, а ветви подписываются бутстрэп-поддержкой — процентом деревьев, в которых встретилась данная ветвь (нетривиальная)."

Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку белков), далее методом Neighbor-Joining построено дерево (Analysis -> Phylogeny -> Neighbor-Joining, при этом в окошке надо было выбрано est of Phylogeny - Bootstrap method, число реплик 100) и сохранено в png и nwk.

16S

В списке по ссылке ftp://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/ был найден all.frn.tar.gz, в котором лежит информация по разным штаммов разных бактерий. Из fastа файлов вырезаны последовательности 16S рРНК и положены в файл 16S.fasta с заменой длинных названий на мнемоники видов. В Jalview File -> Input alignment -> Выбор 16.fasta. Далее выравнивание с помощью Muscle (Web Service -> Alignment -> ...). Выравнивание сохранено в файл 16Salign.fa. Файл с выравниванием был открыт программой MEGA (File -> Open, согласиться на Analyze и выделить строчку нуклеотидов), далее разными способами построены деревья (Analysis -> Phylogeny -> ...).

Учебный сайт Птицыной Елены

Cтудентки первого курса факультета биоинженерии и биоинформатики Московского государственного университета имени М.В. Ломоносова