Учебная страница курса биоинформатики,
год поступления 2015
Занятие 3.
Отчёт по первому заданию выставляете на свой сайт, со ссылкой со страницы семестра, к утру дня следующего занятия (10 марта).
Второе и третье задания готовите к "защите" на следующем занятии (вместе с заданиями предыдущего практикума)
1. Укоренение в среднюю точку
Укорените в среднюю точку дерево, построенных при выполнении задания 4 предыдущего занятия (методом Neighbor-Joining using % identity).
К сожалению, программа MEGA по не совсем понятным причинам отказывается переукоренять деревья, построенные JalView. Поэтому воспользуйтесь программой retree пакета PHYLIP. Для этого:
Скопируйте файл retree.exe из директории /S/Programs/PHYLIP/phylip-3.695/exe на kodomo в свою рабочую директорию.
- Скопируйте файл с деревом в Newick-формате в файл с именем intree (именно так, без расширения!)
Запустите retree (из командной строки Windows; например можно в Far manager навести курсор на файл retree.exe и нажать <Enter>).
- Постарайтесь сами разобраться, как работать с программой retree. Для этого внимательно читайте то, что появляется в окне. Нужное вам действие — укоренение в среднюю точку ("Midpoint root the tree").
Вставьте в отчёт изображение укоренённого дерева, сделанное программой MEGA, и опишите его (в какую ветвь произошло укоренение, можно ли это укоренение считать правильным, может быть, ещё какие-то наблюдения).
Для тех, кто хочет делать задание на своём не-Windows компьютере: скачайте себе пакет PHYLIP.
2. Использование внешней группы
Деревья, построенные методом максимальной экономии ("Maximum parsimony") невозможно укоренить в среднюю точку (почему?). Однако можно воспользоваться укоренением с помощью внешней группы. Реконструируйте методом максимальной экономии укоренённое дерево отобранных вами бактерий, используя в качестве внешней группы белок того же семейства из кишечной палочки (Escherichia coli, мнемоника ECOLI в Uniprot).
Подсказка: необходимо добавить к файлу с невыровненными последовательностями белков фирмикут последовательность белка из кишечной палочки, после чего выровнять их вместе.
Затем надо отредактировать имена (оставив только мнемонику видов) и результат импортировать в программу MEGA. После реконструкции дерева нужно в меню Subtree выбрать Root и указать в качестве корня ветвь, ведущую к ECOLI. Наконец, чтобы получить изображение укоренённого дерева без ECOLI, нужно воспользовавться кнопкой "Show Subtree Separately" (изображение голубой лупы на фоне дерева на левой панели окна MEGA),
Сохраните выравнивание с отредактированными именами. Будьте готовы проделать описанные действия в MEGA и прокомментировать результат.
3. Бутстрэп
Проведите бутстрэп-анализ филогении своих белков, используя один из методов, доступных из программы MEGA. Для этого в окошке, которое открывается после вызова программы, в меню "Test of Phylogeny" выберите "Bootstrap method". Укажите число реплик, равное 100.
Отличаются ли деревья, названные "Original tree" и "Bootstrap consensus tree"? Если да, то какое из них ближе к правильному (близость определяется по числу общих ветвей). Верно ли, что неправильные ветви (если они присутствуют в полученной реконструкции) имеют меньшую поддержку, чем правильные? Будьте готовы ответить на вопрос о смысле чисел на ветвях.
4* (необязательное) Проверка дерева цитохромов b
Задание
Повторить работу, проделанную в 2000 году Michael Schütz и коллегами (см. слайд 10 в презентации). Используйте метод реконструкции, который использовали авторы (найдите статью и дерево в ней; посмотрите, что это за метод), а также любые два других метода реконструкции. На отдельной HTML-странице опишите результаты: совпадает ли ваше дерево, построенное таким же методом, как у авторов, по топологии с их деревом, отличаются ли величины поддержки бутстрепа и длины ветвей? Что можно сказать о совпадении с деревьями, построенными другими методами? На основании всех полученных данных — в какую точку вы укоренили бы дерево? Опишите также другие выводы и соображения.
Как найти статью, если ее выходные данные указаны очень кратко
Найдите нужную статью с помощью Google Scolar по следующим исходным данным:
Фамилия одного из авторов – Schütz;
- Год публикации 2000;
Статья имеет отношение к цитохромам b (т.е. фраза "cytochrome b" в тексте статьи встречается).
Указания
В этом файле содержатся последовательности белков, которые, судя по всему, использовались в 2000 году для построения дерева цитохромов b (см. слайд 10 презентации). Названия некоторых организмов с тех пор немного изменились, так бывает (кстати, заметьте, что при смене родового названия из-за уточнения классификации стараются сохранять видовое название):
Geobacillus stearothermophilus = Bacillus stearothermophilus;
Acidithiobacillus ferrooxidans = Thiobacillus ferrooxidans (в этом организме 2 фермента с идентификаторами GI:218665797 и GI:218666252, но они очень похожи, поэтому в выборку был взят произвольно один из них);
Rhodopseudomonas viridis = Blastochloris viridis;
Rhodopseudomonas sphaeroides = Rhodobacter sphaeroides.