Учебная страница курса биоинформатики,
год поступления 2020
Занятие 3
Задания 1–3 вы готовите к коллоквиуму 11 марта, на котором показываете и объясняете результаты.
1. Укоренение с использованием внешней группы
MEGA автоматически укореняет деревья в среднюю точку, если это возможно. Деревья, построенные методом максимальной экономии ("Maximum parsimony") невозможно укоренить в среднюю точку (почему?), но можно укоренить с помощью внешней группы. Реконструируйте методом максимальной экономии укоренённое дерево отобранных вами бактерий, используя в качестве внешней группы белок того же семейства из сенной палочки (Bacillus subtilis, мнемоника BACSU в Uniprot).
Подсказка: необходимо добавить к файлу с невыровненными последовательностями белков актинобактерий последовательность белка из сенной палочки, после чего выровнять их вместе.
Затем надо отредактировать имена (оставив только мнемонику видов) и результат импортировать в программу MEGA. После реконструкции дерева нужно в меню Subtree выбрать Root и указать в качестве корня ветвь, ведущую к BACSU. Наконец, чтобы получить изображение укоренённого дерева без BACSU, нужно воспользоваться кнопкой "Show Subtree Separately" (изображение голубой лупы на фоне дерева на левой панели окна MEGA),
Сохраните выравнивание с отредактированными именами. Будьте готовы проделать описанные действия в MEGA и прокомментировать результат на коллоквиуме.
2. Бутстрэп
Проведите бутстрэп-анализ филогении своих белков, используя один из методов, доступных из программы MEGA. Для этого в окошке, которое открывается после вызова программы, в меню "Test of Phylogeny" выберите "Bootstrap method". Укажите число реплик, равное 100.
Отличаются ли деревья, названные "Original tree" и "Bootstrap consensus tree"? Если да, то какое из них ближе к правильному (близость определяется по числу общих ветвей). Верно ли, что неправильные ветви (если они присутствуют в полученной реконструкции) имеют меньшую поддержку, чем правильные? Будьте готовы ответить на вопрос о смысле чисел на ветвях.
3. Построение дерева по нуклеотидным последовательностям
Постройте филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).
Этапы работы:
Добудьте последовательности 16S рибосомальной РНК каждой из ваших бактерий из базы полных геномов NCBI (проще всего со старой версии страницы: https://ftp.ncbi.nlm.nih.gov/genomes/archive/old_refseq/Bacteria/, но можете поискать и новой версии, через базу Genomes). Можно брать геном любого штамма нужного вида (если данного вида вообще нет, можно брать другой вид того же рода, но лучше разобраться, какие синонимы есть у нужного видового названия – наверняка этот вид есть, просто назван по-другому). Разберитесь самостоятельно, в каком из файлов находится последовательность 16S РНК.
- Положите все последовательности в единый файл в fasta-формате, отредактируйте их названия, чтобы они отвечали организмам, и выровняйте.
- Файл с выравниванием импортируйте в программу MEGA (указав Analyze при импорте) и выберите один из методов "верхней тройки" в меню "Phylogeny".
На коллоквиуме 11 марта вы должны будете:
- загрузить в MEGA выравнивание 16S РНК, без долгих поисков (оно должно лежать в понятном месте в файле с понятным названием);
- реконструировать дерево методом, указанным преподавателем;
- сравнить качество реконструкции по 16S РНК с качеством реконструкции по белку.