Подсказки к упражнениям занятия 2

 
     

 

  1. Можно воспользоваться графическим редактором Paint или автофигурами Word. В первом случае рекомендуется сохранить рисунок в формате GIF.

  2. Описание разбиений оформляются в виде таблички, столбцы которой соответствуют листьям дерева, а строки - ветвям дерева.

    Над столбцами надо поместить идентификаторы листьев (в нашем случае это просто буквы; если же листья называются длинно, то обычно их нумеруют и в строке заголовков помещают номера).

    Каждая строка, описывающая ветвь, заполняется символами двух типов (0 и 1, или + и -, чаще всего . (точка) и * (звёздочка)). Одним символом помечаются листья, находящиеся по одну сторону от данной ветви. Например, дерево

             +----- F
             |
       +-----+   +-- A
       |     |   |
       |     +---+
       |         |
       |         +-- B
       |  +--- C
       |  |
       +--+    +--- D
          |    |
          +----+
               |
               +--- E
    
    описывается следующей табличкой:
      A B C D E F
      . * * * * *
      . . * * * *
    
      . . * * * .
      . . . * * .
      * . * * * *
      * * . * * *
      * * * . * *
      * * * * . *
      * * * * * .
    
    Для ориентировки одна из ветвей и на рисунке и в табличке выделена красным. Эта ветвь отделяет листья A и B от всех остальных (C, D, E и F). (В вашем отчёте ничего выделять не надо!).

    Внимание! Поскольку ветвь, отделяющая один (любой!) лист от всех остальных, есть в любом дереве, описание таких ветвей не несёт полезной информации. Поэтому правильнее опускать его; таким образом, правильное описание топологии приведённого дерева состоит всего из трёх строк, отвечающих трём внутренним ветвям:

      A B C D E F
      . . * * * *
      . . * * * .
      . . . * * .
    
  3. Создайте специальную директорию для мутантных последовательностей, скопируйте туда последовательность гена.

    Придумайте естественное имя файла для каждой из мутантных последовательностей (например, ABC.fasta для общего предка листьев A, B и C). Пересчитайте длины ветвей в число мутаций, которые надо будет произвести при получении каждой последовательности из её предка.

    Для получения "мутантов" воспользуйтесь программой msbar пакета EMBOSS. Составьте скрипт, строки которого имеют вид:

    msbar infile outfile -point 4 -count n -auto
    
    Подставьте в каждой строке вместо "infile" имя файла с последовательностью, в которую надо внести мутации, а вместо "outfile" - имя файла, в котором будет находится измененная последовательность. Вместо n подставьте число мутаций, которое нужно внести. Сохраните файл как текст UNIX (воспользуйтесь в редакторе FAR'а). Сделайте скрипт исполняемым, выполнив (на kodomo-count) команду
    chmod +x имя_скрипта
    
    Запустите скрипт (выполните команду ./имя_скрипта).

     

  4. Поместите последовательности, соответствующие листьям дерева, в один файл в виде "выравнивания" в fasta-формате. Поменяйте имена последовательностей (программа msbar сохраняет для мутантной последовательности имя, которое имела исходная). Чтобы реконструировать дерево алгоритмом максимального правдоподобия, запустите программу fdnaml:
    fdnaml ali.fasta -ttratio 1 -auto
    
    (вместо ali.fasta подставьте имя файла с выравниванием). В Вашей рабочей директории появятся два файла: один - с расширением .treefile, второй - с расширением .dnaml. Именно в последнем файле можно найти "текстово-графическое" изображение дерева, годное для помещения в отчёт (шрифтом постоянной ширины! В Word это "Courier New", а в HTML лучше всего воспользоваться тэгом преформатирования <PRE>).

    Чтобы реконструировать дерево алгоритмами UPGMA или Neighbor-joining, сначала надо посчитать попарные расстояния между последовательностями программой fdnadist:

    fdnadist ali.fasta -ttratio 1 -auto
    
    результат окажется в файле с расширением .fdnadist. После этого этот файл надо подать на вход программе fneighbor:
    fneighbor ali.fdnadist -auto
    
    для реконструкции алгоритмом Neighbor-joining и
    fneighbor ali.fdnadist -treetype u -auto
    
    
    для реконструкции алгоритмом UPGMA. При этом ваш ответ оба раза будет записан в файл с расширением .fneighbor, поэтому второй запуск программы уничтожит результаты первого! Чтобы этого не случилось, надо либо переименовать выходной файл после первого запуска, либо добавить в командную строку параметр -outfile имя_файла.

    Чтобы сравнить деревья, надо сравнить их ветви (понимаемые как разбиения множества листьев). Составьте табличку, в левой части которой приведите (в виде точек и звёздочек) все ветви, встреченные во всех ваших деревьях (исходном и трёх реконструкциях), а в правой добавьте четыре столбца, соответствующие четырём деревьям. Пометьте (например, знаком +), в каких деревьях встретилась каждая из ветвей.