|
|
|
- Можно воспользоваться графическим редактором Paint или автофигурами Word.
В первом случае рекомендуется сохранить рисунок в формате GIF.
- Описание разбиений оформляются в виде таблички, столбцы которой соответствуют
листьям дерева, а строки - ветвям дерева.
Над столбцами надо поместить идентификаторы листьев (в нашем случае это
просто буквы; если же листья называются длинно, то обычно их
нумеруют и в строке заголовков помещают номера).
Каждая строка, описывающая ветвь, заполняется
символами двух типов (0 и 1, или + и -, чаще всего . (точка) и * (звёздочка)).
Одним символом помечаются листья, находящиеся по одну сторону от данной
ветви. Например, дерево
+----- F
|
+-----+ +-- A
| | |
| +---+
| |
| +-- B
| +--- C
| |
+--+ +--- D
| |
+----+
|
+--- E
описывается следующей табличкой:
A B C D E F
. * * * * *
. . * * * *
. . * * * .
. . . * * .
* . * * * *
* * . * * *
* * * . * *
* * * * . *
* * * * * .
Для ориентировки одна из ветвей и на рисунке и в табличке выделена красным.
Эта ветвь отделяет листья A и B от всех остальных (C, D, E и F). (В вашем
отчёте ничего выделять не надо!).
Внимание! Поскольку ветвь, отделяющая один (любой!) лист от всех остальных,
есть в любом дереве, описание таких ветвей не несёт полезной информации. Поэтому
правильнее опускать его; таким образом, правильное описание топологии приведённого
дерева состоит всего из трёх строк, отвечающих трём внутренним ветвям:
A B C D E F
. . * * * *
. . * * * .
. . . * * .
- Создайте специальную директорию для мутантных последовательностей,
скопируйте туда последовательность гена.
Придумайте естественное имя файла для каждой из мутантных последовательностей
(например, ABC.fasta для общего предка листьев A, B и C). Пересчитайте длины
ветвей в число мутаций, которые надо будет произвести при получении
каждой последовательности из её предка.
Для получения "мутантов" воспользуйтесь программой msbar
пакета EMBOSS. Составьте скрипт, строки которого имеют вид:
msbar infile outfile -point 4 -count n -auto
Подставьте в каждой строке вместо "infile" имя файла с последовательностью,
в которую надо внести мутации, а вместо "outfile" - имя файла,
в котором будет находится измененная последовательность.
Вместо n подставьте число мутаций, которое нужно внести.
Сохраните файл как текст UNIX (воспользуйтесь в редакторе FAR'а).
Сделайте скрипт исполняемым, выполнив (на kodomo-count) команду
chmod +x имя_скрипта
Запустите скрипт (выполните команду ./имя_скрипта).
- Поместите последовательности, соответствующие листьям дерева, в один
файл в виде "выравнивания" в fasta-формате. Поменяйте имена последовательностей
(программа msbar сохраняет для мутантной последовательности имя, которое имела
исходная).
Чтобы реконструировать дерево алгоритмом максимального правдоподобия,
запустите программу fdnaml:
fdnaml ali.fasta -ttratio 1 -auto
(вместо ali.fasta подставьте имя файла с выравниванием). В Вашей рабочей
директории появятся два файла: один - с расширением .treefile,
второй - с расширением .dnaml. Именно в последнем файле можно
найти "текстово-графическое" изображение дерева, годное для помещения в
отчёт (шрифтом постоянной ширины! В Word это "Courier New", а в HTML
лучше всего воспользоваться тэгом преформатирования <PRE>).
Чтобы реконструировать дерево алгоритмами UPGMA или Neighbor-joining,
сначала надо посчитать попарные расстояния между последовательностями
программой fdnadist:
fdnadist ali.fasta -ttratio 1 -auto
результат окажется в файле с расширением .fdnadist. После этого
этот файл надо подать на вход программе fneighbor:
fneighbor ali.fdnadist -auto
для реконструкции алгоритмом Neighbor-joining и
fneighbor ali.fdnadist -treetype u -auto
для реконструкции алгоритмом UPGMA. При этом ваш ответ оба раза будет
записан в файл с расширением .fneighbor, поэтому второй запуск программы
уничтожит результаты первого! Чтобы этого не случилось, надо либо переименовать
выходной файл после первого запуска, либо добавить в командную строку
параметр -outfile имя_файла.
Чтобы сравнить деревья, надо сравнить их ветви (понимаемые как разбиения
множества листьев). Составьте табличку, в левой части которой приведите
(в виде точек и звёздочек) все ветви, встреченные во всех ваших деревьях
(исходном и трёх реконструкциях),
а в правой добавьте четыре столбца, соответствующие четырём деревьям.
Пометьте (например, знаком +), в каких деревьях встретилась каждая из ветвей.
|