Укоренение деревьев
Бутстреп-анализ
Задание 1: Укорненение с использованием внешней группы
В этом задании надо было полученное в прошлом практикуме филогенетическое дерево протеобактерий (по белку RSMH) укоренить с использованием внешней группы. В качестве внешней группы была выбрана сенная палочка Bacillus subtilis (BACSU).
Сначала последовательности соответствующих белков (RSMH), включая белок сенной палочки, были повторно выровнены, а позже построено дерево методом MP (см. рис. 1). После этого было выделено укоренённое поддерево исходных бактерий (см. рис. 2).
Как мы можем заметить, по сравнению с референсом из первого практикума дерево у нас укоренилось совершенно неправильно.
Задание 2: Бутстреп
В этом задании надо было провести бутстреп-анализ филогении (если так можно выразиться) моих бактерий по белку RSMH и, собственно, сформулировать какой-либо вывод с помощью полученных результатов.
Так как MEGAX у меня окончательно отказалась работать (MacOS Big Sur), я решил провести бутстреп-анализ с помощью программ из пакета
Шаг 1. Сначала я перенёс на
$ fseqboot -seqtype p RSMH_align.fasta
Программа
Шаг 2. Далее из полученных реплик надо построить деревья. Сделал я это с помощью метода максимального правдоподобия:
$ fproml rsmh_align.fseqboot
Расшифровывается программа так:
Шаг 3. Осталось получить консенсус:
$ fconsense rsmh_align.treefile
Программа
Сразу стоит сказать, что надёжной я считал ветвь с бутстреп-поддержкой больше 50. И как мы можем заметить, после бутстреп-анализа у нас произошло разделение: 2 ветви оказалась ненадёжными, а остальные - надёжными. И этими двумя ненадёжными ветвями оказались как раз в точности неправильные ветви! В то время как правильные ветви получили бутстреп-поддержку больше 50 (большинство получило даже ровно 100). Это нам говорит о том, что даже не смотря на 2 неправильные ветви, само по себе дерево получилось довольно близким к консенсусу, который мы получили в практикуме 1.
Задание 3: Построение дерева по нуклеотидным последовательностям
В этом задании надо было построить филогенетическое дерево всё тех же бактерий, что в предыдущих заданиях, используя последовательности 16S rRNA.
Собственно, план таков:
- Скачать последовательности;
- Выровнять последовательности (буду использовать программу
muscle ); - Построить филогенетическое дерево (использовать буду программы пакета
PHYLIP ; строить филогенетическое дерево с помощью метода Neighbor-Joining); - Визуализировать дерево (в моём случае это будет FigTree).
Поехали!
Шаг 1. Сначала надо скачать последовательности 16S rRNA. Сделал я это таким образом: просто нашёл и скопировал с сайта. На этом сайте каждая папка - бактериальный штамм, а в каждой папке есть файл(ы) с расширением
Шаг 2. Далее я выровнял последовательности с помощью программы
$ muscle -in 16SrRNA_bacts.fasta -out 16SrRNA_bacts_align.fasta
И посчитал матрицу расстояний между последовательностями:
$ fdnadist 16SrRNA_bacts_align.fasta
Программа
Шаг 3. Построил филогенетическое дерево методом Neighbor-Joining:
$ fneighbor 16srrna_bacts_align.fdnadist
Программа
Шаг 4. Ну и, собственно, визуализация с помощью FigTree:

Собственно, как можно сразу заметить, дерево полностью совпадает с консенсусом из прошлого задания. Это всё нам говорит о том, что реконструкция филогении по 16S рРНК-метилтранферазе H настолько же надёжна, как и реконструкция по само́й невероятно консервативной 16S рРНК. Можно даже предположить, что 16S рРНК-метилтранфераза Н имеет схожую степень консервативности, что и 16S рРНК, но это уже совсем другая история... Но при этом мы всё ещё имеем 2 неправильные ветви.