|
Занятие 2. Моделирование и реконструкция эволюции гена
-
Дерево, описанное формулой: (((А:90,B:90):15,C:80):20,((D:50,E:50):4,F:70):30);
*Дерево не ультраметрично: не существует точки, равноудаленной от всех листьев.
-
Описание ветвей этого дерева как разбиения множества листьев (считая дерево бескорневым):
A B C D E F
. . * * * *
. . . * * *
. . . * * .
-
Моделирование эволюции гена ilvC
Получим искуственные мутантные последовательности, соответствующие листьям и узлам
дерева (в корне находится последовательность гена белка ILVC_ECOLI) с помощью скрипта:
msbar m.fasta 11mut.fasta -point 4 -count 295 -auto
msbar m.fasta 12mut.fasta -point 4 -count 443 -auto
msbar 11mut.fasta Cmut.fasta -point 4 -count 1181 -auto
msbar 11mut.fasta 21mut.fasta -point 4 -count 221 -auto
msbar 21mut.fasta Amut.fasta -point 4 -count 1328 -auto
msbar 21mut.fasta Bmut.fasta -point 4 -count 1328 -auto
msbar 12mut.fasta 22mut.fasta -point 4 -count 59 -auto
msbar 12mut.fasta Fmut.fasta -point 4 -count 1033 -auto
msbar 22mut.fasta Dmut.fasta -point 4 -count 738 -auto
msbar 22mut.fasta Emut.fasta -point 4 -count 738 -auto
Где m.fasta - исходная последовательность, кодирующая белок ILVC_ECOLI, длины 1476 нуклеотидов.
Point - это тип произведенных мутаций: 0 - нет мутации, 1 - любая из пяти последующих,
2 - вставки, 3 - делеции, 4 - замены, 5 - дупликации, 6 - перестановки.
Число замен рассчитывалось по формуле
[длина посл-ти*длина ветви]/100
-
Реконструкция эволюции гена ilvC
- Алгоритм максимального правдоподобия (значение ttratio -
это отношение числа транзиций к числу трансверсий, т. е. выбор эволюционной модели)
fdnaml ALL.fasta -ttratio 1 -auto
+----------------------B
|
| +---------------F
| +--------4
| | | +------------E
1-----2 +---3
| | +------------D
| |
| +-------------------C
|
+--------------------A
- Алгоритм UPGMA (строит укорененное дерево)
fdnadist ALL.fasta -ttratio 1 -auto
fneighbor all.fdnadist -treetype u -auto
+-------------------------------------------A
+--------3
! +-------------------------------------------B
--5
! +---------------------------------------------C
! !
+------4 +------------------------D
! +-----1
+--------------2 +------------------------E
!
+------------------------------F
Заметим, что дерево укоренено неверно - на исходном дереве корень рядом с 4-ым узлом.
- Алгоритм Neighbor-joining
fdnadist ALL.fasta -ttratio 1 -auto
fneighbor all.fdnadist -auto
+-----------------------B
!
! +-------------------C
! !
1-----2 +------------D
! ! +--3
! +----------4 +-----------E
! !
! +---------------F
!
+-------------------A
Cравнение топологии полученных деревьев:
A B C D E F | Исходное | Максимального правдоподобия | UPGMA | Neighbor-joining |
. . * * * * |
+ | + | + | + |
. . . * * * |
+ | + | + | + |
. . . * * . |
+ | + | + | + |
ИТОГО: топология деревьев совпадает, т. е. все алгоритмы правильно реконстрировали исходное дерево (если считать UPGMA дерево бескорневым).
|