Учебная страница курса биоинформатики,
год поступления 2020
Программа коллоквиума 11 марта 2022
На коллоквиуме нужно будет:
- Открыть в MEGA (если MEGA не работает, то в Jalview) выравнивание последовательностей белков отобранных вами бактерий, ответить на вопрос, что это за белки.
- Продемонстрировать результаты реконструкции филогении несколькими методами, рассказать про эти методы.
- Для одного из деревьев: указать все нетривиальные ветви.
- Открыть на своей странице изображение эталонного дерева данных организмов. Сказать, отличается ли топология реконструированного дерева от топологии эталонного. Если отличается, то указать различающиеся ветви. Если нет, то объяснить, почему вы в этом уверены. То же про укоренение.
- В MEGA: провести бутстреп-анализ (метод Neighbor-Joining, число реплик 100). Если MEGA не работает, продемонстрировать результат (картинку из iTOL или другого визуализатора) бутстреп-анализа (задание 2 к занятию 3).
- Объяснить, как проводится бутстреп-анализ, в частности, смысл чисел на ветвях.
- Сравнить результат бутстреп-анализа с эталонным деревом. Если не все ветви верные: верно ли, что неверные ветви хуже поддержаны?
- Продемонстрировать процедуру укоренения дерева, реконструированного методом максимальной экономии, с помощью внешней группы (в MEGA), или подробно объяснить процедуру и продемонстировать результат (если MEGA не работает).
- Сравнить с эталоном дерево, укоренённое с помощью внешней группы, прокомментировать корректность укоренения.
- Открыть в MEGA выравнивание последовательностей 16S РНК, провести реконструкцию, сравнить с эталоном и прокомментировать. Если MEGA не работает, показать результат реконструкции и подробно изложить процедуру.
- По дереву, нарисованному преподавателем и какой-нибудь нетривиальной ветви на нём:
- нарисовать два дерева, получаемых локальными перестройками (NNI) из данного дерева по данной ветви;
- для одного из этих деревьев: нарисовать укоренение в эту ветвь в прямоугольном виде;
- написать формулу в формате Newick для этого укоренения.
- Ответить на один-два вопроса из следующего списка:
- Что такое ортологи и паралоги?
- Почему дерево ортологичных белков не всегда совпадает с деревом соответствующих организмов?
- Что такое "ультраметрическое дерево"? При каком предположении имеет смысл строить такое дерево?
- Что такое свойство "аддитивности" (расстояний между листьями по дереву)
- Объяснить, как расстояния между последовательностями оцениваются на основании принципа наибольшего правдоподобия.
Сколько ветвей у разрешённого дерева с n листьями? Сколько из них нетривиальных?
- Как подсчитать число различных (разрешённых и неукоренённых) деревьев для заданного набора организмов?
Важно: все файлы, необходимые для ответов на вопросы 1–10, должны быть готовы заранее, при этом лежать в таких директориях и называться так, чтобы вы их находили без проблем, с первой попытки. Последовательности в выравниваниях и листья в деревьях должны называться мнемониками видов.