Учебная страница курса биоинформатики,
год поступления 2021
Практикум 3
Задания 1–3 вы готовите к коллоквиуму 17 марта, на котором показываете и объясняете результаты.
1. Укоренение с использованием внешней группы
Укоренение в среднюю точку предусмотрено в iTOL (см. предыдущее задание). Задача — сравнить это укоренение с укоренением посредством внешней группы. Реконструируйте одним из методов, выдающих длины ветвей, укоренённое дерево отобранных вами бактерий, используя в качестве внешней группы белок того же семейства из сенной палочки (Bacillus subtilis, мнемоника BACSU в Uniprot).
Подсказка: необходимо добавить к файлу с невыровненными последовательностями белков актинобактерий последовательность белка из сенной палочки, после чего отредактировать имена (оставив только мнемонику видов) и результат подать в программу NGPhylogeny.fr (сформировав там один из конвейеров, использованных в предыдущий раз). После реконструкции дерева нужно найти ветвь, ведущую к BACSU, щёлкнуть по ней и найти, как поставить корень в эту ветвь. Сохраните изображение переукоренённого дерева. Будьте готовы ответить на вопрос, отличаются ли топология и укоренение от результата использования того же конвейера, но без внешней группы.
2. Бутстреп
Проведите бутстреп-анализ филогении своих белков, используя один из методов, доступных из программы MEGA. Для этого после формирования конвейера нужно открыть список параметров выбранной программы и найти там бутстреп. Укажите число реплик, равное 100.
Добейтесь, чтобы на изображении дерева в iTOL были видны числа поддержки на ветвях. Сохраните изображение. Будьте готовы ответить на вопросы: изменилась ли топология от применения бутстрепа и верно ли, что правильные ветви реконструкции имеют большую поддержку по сравнению с неправильными.
3. Построение дерева по нуклеотидным последовательностям
Постройте филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).
Этапы работы:
Добудьте последовательности 16S рибосомальной РНК каждой из ваших бактерий из базы полных геномов NCBI (проще всего со старой версии страницы: https://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/, но можете поискать и в новой версии, через базу Genomes). Можно брать геном любого штамма нужного вида (если данного вида вообще нет, можно брать другой вид того же рода, но лучше разобраться, какие синонимы есть у нужного видового названия – наверняка этот вид есть, просто назван по-другому). Разберитесь самостоятельно, в каком из файлов находится последовательность 16S РНК.
- Положите все последовательности в единый файл в fasta-формате, отредактируйте их названия, чтобы они отвечали организмам, и выровняйте.
- Выполните реконструкцию филогении (любым методом, но будьте готовы ответить, каким именно), укорените в среднюю точку, сохраните изображение и формулу Newick, сравните качество реконструкции с таковой по белкам.
На коллоквиуме 17 марта вы должны будете показать изображение и формулу и ответить на вопросы о верных/неверных ветвях и о качестве реконструкции по сравнению с белками.