Учебная страница курса биоинформатики,
год поступления 2022
Практикум 3
Задания 1–3 вы готовите к коллоквиуму 22 марта, на котором показываете и объясняете результаты.
1. Укоренение с использованием внешней группы
Укоренение в среднюю точку предусмотрено в iTOL (см. предыдущее задание). Задача — сравнить это укоренение с укоренением посредством внешней группы. Реконструируйте одним из методов, выдающих длины ветвей, укоренённое дерево отобранных вами бактерий, используя в качестве внешней группы белок того же семейства либо из сенной палочки (Bacillus subtilis, мнемоника BACSU в Uniprot), либо из Helicobacter pylory (мнемоника HELPY).
Подсказка: необходимо добавить к файлу с невыровненными последовательностями белков протеобактерий последовательность белка из дополнительной бактерии, после чего отредактировать имена (оставив только мнемонику видов) и результат подать в программу NGPhylogeny.fr (сформировав там один из конвейеров, использованных в предыдущий раз). После реконструкции дерева нужно найти ветвь, ведущую к внешней группе, щёлкнуть по ней и найти, как поставить корень в эту ветвь.
Сохраните изображение переукоренённого дерева. Будьте готовы ответить на вопрос, отличаются ли топология и укоренение от результата использования того же конвейера, но без внешней группы и с укоренением в среднюю точку.
2. Бутстреп
Проведите бутстреп-анализ филогении своих белков, используя один из быстрых методов, доступных в NGPhylogeny.fr (FastME или TNT). Для этого после формирования конвейера нужно открыть список параметров выбранной программы и найти там бутстреп. Укажите число реплик, равное 100.
Добейтесь, чтобы на изображении дерева в iTOL были видны числа поддержки на ветвях. Сохраните изображение. Будьте готовы ответить на вопросы: изменилась ли топология от применения бутстрепа и верно ли, что правильные ветви реконструкции имеют большую поддержку по сравнению с неправильными.
3. Построение дерева по нуклеотидным последовательностям
Постройте филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).
Этапы работы:
Добудьте последовательности 16S рибосомальной РНК каждой из ваших бактерий из базы полных геномов NCBI. Можно брать геном любого штамма нужного вида (если данного вида вообще нет, можно брать другой вид того же рода, но лучше разобраться, какие синонимы есть у нужного видового названия – наверняка этот вид есть, просто назван по-другому). Разберитесь самостоятельно, в каком из файлов находится последовательность 16S РНК.
- Положите все последовательности в единый файл в fasta-формате, отредактируйте их названия, чтобы они отвечали организмам, и выровняйте.
- Выполните реконструкцию филогении (любым методом, но будьте готовы ответить, каким именно), укорените в среднюю точку, сохраните изображение и формулу Newick, сравните качество реконструкции с таковой по белкам.
На коллоквиуме 22 марта вы должны будете показать изображение и формулу и ответить на вопросы о верных/неверных ветвях и о качестве реконструкции по сравнению с белками.