Первое знакомство с филогенетическими деревьями

Материалы к занятию 14
 
     
Для выполнения данного задания Вам понадобятся:
  1. файл с "эталонным" множественным выравниванием домена (файл xxx.msf, созданный на занятии № 10); идеальный вариант — выравнивание пяти полных доменов, но можно использовать benchmark.msf;
  2. матрица попарных совпадений последовательностей в этом выравнивании, см. дополнительное задание занятия №10.

I. Построить дерево по алгоритму UPGMA

Создайте Excel-книгу UPGMA.xls.

  1. Постройте матрицу "наивных" эволюционных расстояний между последовательностями Вашего выравнивания
  2. Договоримся считать эволюционным расстоянием (D) величину D = 100 – P, где P — процент идентичности. Скопируйте матрицу попарных совпадений на лист, названный "Distances". Рядом создайте матрицу попарных эволюционных расстояний (формулы должны быть видны!)

  3. Постройте дерево
  4. Cкопируйте матрицу попарных эволюционных расстояний на новый лист, назовите лист "UPGMA". Выделите минимальное расстояние в матрице красным цветом. Ниже напишите "Шаг 1" и создайте новую таблицу, в которой ближайшие последовательности будут объединены в один кластер, а расстояния от нового кластера до каждой из оставшихся последовательностей — вычислены как среднее расстояние до объединенных последовательностей. Отметьте минимальное расстояние и повторите процедуру, подробнее см. подсказку.

  5. Напишите правильную скобочную структуру получившегося дерева.

II. Получить и cравнить 2 изображения построенного дерева

Существует много программ для графической визуализации дерева по его правильной скобочной структуре.
На данном занятии используйте 2 программы из Online-версии пакета Phylip: drawtree и drawgram (все параметры по умолчанию).
Ваша задача:
  • получить 2 графических файла;
  • сравнить изображения, созданные разными программами;
  • определить, какое из изображений лучше отражает Ваше представление о данном дереве (пояснить, почему!);
  • по выбранной на предыдущем этапе картинке кратко описать сценарий эволюции (например, "от гипотетической общей предковой последовательности произошли последовательности A и B, затем ...").
Подсказка. На вход обеих программ подается правильная скобочная структура, а на выходе получается картинка в Postscript-формате в виде файла plotfile.ps. Файл можно скопировать на свой компьютер, а затем либо открыть посредством GhostView, либо непосредственно вставить в Word-документ (Insert → Picture → From file). Скопировав полученный рисунок в любой графический редактор (например, в Paint), можно сохранить его в формате GIF.

 Для интересующихся: список всех программ Online-версии Phylip см. здесь.

III. Получить и описать дерево, построенное по методу ближайших соседей

Переведите эталонное выравнивание в формат FASTA. Это можно сделать с помощью Genedoc или на kodomo-count командой

 seqret xxx.msf xxx.fasta
Постройте множественное выравнивание последовательностей из xxx.fasta с помощью программы emma, руководящее дерево (guide tree) сохраните в файле NJ.dnd. Посмотрите, что содержит этот файл.

Получите и сравните 2 изображения этого дерева, см. упражн. II. Сравните NJ-дерево с UPGMA-деревом. И прежде всего, ответьте на вопрос, одинаковый ли сценарий эволюции получился при реконструкции разными методами?

Формат отчета

Формат отчета — HTML-страничка, названная "Tree"; заголовок: "Филогенетические деревья, реконструированные разными способами"
Эталонное выравнивание доменов с указанием идентификатора семейства доменов.
Гиперссылка на рабочую книгу UPGMA.xls.
2 картинки с двумя изображениями UPGMA-дерева. Рядом — обсуждение в соответствии с упр. II
2 картинки с двумя изображениями NJ-дерева. Рядом — обсуждение в соответствии с упр. III.