Занятие 2.

Моделирование и реконструкция эволюции гена





Модель судьбы моего гена в виде скобочной формулы:
(((А:10,B:10):30,((C:20,D:20):5,E:30):10):60,F:100);
Филогенетическое дерево:

Длины ветвей даны как число мутаций на 100 нуклеотидов гена.

Разбиение описываем в виде таблички, столбцы которой соответствуют листьям дерева, а строки - ветвям дерева. Дерево считаем бескорневым.
Внешние ветви описывать не имеет смысла(они отделяют только один лист от остальных).

A B C D E F
+ + - - - -
+ + - - + +
- - + + + -

Для получения "мутантов" использовали программу msbar пакета EMBOSS.

Составлен скрипт с учетом того, что последовательность 1273 нуклеотида.

Формула-число мутаций = длина гена*расстояние(длину ветвей)/100

 


 
 
Общая команда:
 
msbar infile outfile -point 4 -count n -auto

Комманды:





msbar SYY.txt F.fasta -point 4 -count 1273 -auto
msbar SYY.txt ABCDE.fasta –point 4 –count 763 –auto
msbar ABCDE.fasta AB.fasta -point 4 -count 382 –auto
msbar AB.fasta A.fasta -point 4 -count 127 -auto
msbar ABCDE.fasta CDE.fasta -point 4 -count 127 -auto
msbar CDE.fasta CD.fasta -point 4 -count 64 -auto
msbar CD.fasta C.fasta -point 4 -count 254 -auto
msbar CD.fasta D.fasta -point 4 -count 254 -auto
msbar CDE.fasta E.fasta -point 4 -count 382 -auto
msbar AB.fasta B.fasta -point 4 -count 127 –auto

Файл со скриптом scripta.txt Файлы с полученными последовательностями лежат в архиве Posledovatel'nosti-mutantu-ninja.zip

Реконструирование дерева алгоритмами UPGMA, Neighbor-joining и максимального правдоподобия





Создали файл со всеми последовательностями.

Далее с помощью, используя команды данные в указаниях к практикуму, создаем деревья.
Сначала был получен файл со всеми последовательностями листьев. Posledovatel'nosti-mutantu-ninja\VSE.txt

Сначала используем алгоритм максимального правдоподобия.
Для этого запускаем программу fdnaml 
 fdnaml VSE.txt -ttratio 1 –auto
 
 
 
gg\vse.fdnaml



Далее алгоритмы, основанные на оценке попарных расстояний: 

Сначала мы посчитали попарные расстояния между последовательностями с помощью fdnadist. 



fdnadist VSE.txt -ttratio 1 –auto 
На выходе получили файл vse.fdnadist Posledovatel'nosti-mutantu-ninja\vse.fdnadist
После этого файл подаем на вход.
 
1.Neighbor-joining method: 
 
fneighbor vse.fdnadist -auto (полученный файл был переименован в NJ.fneighbor)
 
 
 
 gg\NJ.fneighbor
2. UPGMA( укорененное дерево): 





fneighbor vse.fdnadist -treetype u –auto


H:\public_html\gg\vse.fneighbor
Укорененное дерево такое же как исходное, но не укорененные отличны.
Сравнение:


Анализ.

Алгоритм максимального правдоподобия является переборным. Дерево в данном случае получается неультраметраметрическим.

Агоритм Neighbor-joining является эвристическим. Работает с матрицей расстояний, полученной заранее. Дерево получается в данном случае неультраметрическим.

Алгоритм UPGMA является эвристическим. Работает с матрицей расстояний. Дерево получается укорененное ультраметрическое в виде кладограммы.


Топология всех деревьев совпадает, за исключением того, что дерево полученное UPGMA укорененное.
Деревья, созданные алгоритмами максимального правдоподобия и neighbor-joining одинаковы, единственное отличие в нумерации узлов. Наиболее точный результат выдал алгоритм UPGMA. Схожесть результатов может показывать на верность предсказанного эволюционного сценария. Сравнивать и говорить, что какой-то из алгоритмов ГОРАЗДО лучше другого нельзя, поскольку они все дали похожие результаты.