Главная страница четвертого семестра

Моделирование и реконструкция эволюции гена

Изображено дерево, описанное формулой (((А:20,B:20):20,C:40):60,((E:30,F:30):5,D:60):40);. Расстояния даны как число мутаций на 100 нуклеотидных остатков.

Ветви дерева как разбиения множества листьев (считая дерево бескорневым) описываются так:

A B C D E F
* * * . . .
* * . . . .
* * * * . .
Были получены искуственные мутантные последовательности, соответствующие листьям и узлам дерева, считая, что в корне находится нуклеотидная последовательность с EMBL ID J01591 из генома Escherichia coli. Длина гена: 2107 нуклеотидов. Формула для пересчёта расстояний в число мутаций: длина гена*расстояние от узла/100 Текст скрипта, которым получаются мутантные последовательности:
msbar aroGgene.fasta ABC.fasta -point 4 -count 1264 -auto
msbar ABC.fasta C.fasta -point 4 -count 843 -auto   
msbar ABC.fasta AB.fasta -point 4 -count 421 -auto
msbar AB.fasta A.fasta  -point 4 -count 421 -auto
msbar AB.fasta B.fasta  -point 4 -count 421 -auto
msbar aroGgene.fasta DEF.fasta -point 4 -count 843 -auto
msbar DEF.fasta D.fasta -point 4 -count 1264 -auto
msbar DEF.fasta EF.fasta -point 4 -count 105 -auto
msbar EF.fasta E.fasta -point 4 -count 632 -auto
msbar EF.fasta F.fasta -point 4 -count 632 -auto

Получение деревьев

На основе последовательностей, соответствующих листьям, реконструированы деревья алгоритмами UPGMA, Neighbor-joining и максимального правдоподобия.
Ветви деревьев Neighbor-Joining UPGMA Алгоритм максимального правдоподобия 1-ое
Выходные файлы Neighbor-Joining UPGMA Алгоритм максимального правдоподобия  
ABCDEF

+----B
! 
!     +--------С
!     !
1-----2                              +--------------D
!     !                           +--3
!     +---------------------------4  +-------E
!                                 !
!                                 +----F
!
+----A

		 

                                         +---------A
                               +---------1 
  +----------------------------3         +---------B
  !                            ! 
  !                            +-------------------C
--5 
  !                         +----------------------D
  +-------------------------4 
                            !       +--------------E
                            +-------2 
                                    +--------------F

		

        +-------C         
        |  
+-------1                                        +-------F
|       |                                   +----3  
|       +-----------------------------------2    +--------E
|                                           |  
|                                           +------------D
|  
4----B         
|  
+-----A         

		
 
* * * . . . + + + +
* * . . . . + + + +
* * * * . . - + + +
* * * . . * + - - -
Используя разные методы для построения деревьев, мы получаем разные результаты. При этом все равно можно заметить, что модель реальных событий и модели, полученные алгоритмом максимального правдоподобия и методом UPGMA отражают похожие модели эволюции. Их топология одинакова. Поэтому можно сказать, что UPGMA и метод максимального правдоподобия справились с задачей.

Оценка достоверности реконструированной топологии с помощью бутстреп-анализа

С помощью бутстреп-анализа было получено консенсусное дерево.

Этапы работы:

1. Программой fseqboot были созданы 100 бутстреп-реплик выравнивания: fseqboot ali.fasta -auto (результат в файле ali.fseqboot).

2. Подали полученные 100 выравниваний на вход программе fdnaml. В выходном файле (ali.treefile) 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний.

3. Запустили программу fconsense. В выходной файл помещены результаты бутстреп-анализа.

На нем цифрами отмечено количество раз, которое встречается данная ветка в 100 деревьях, построенных по выравниваниям, сделанным с помощью бутстрепа.


                +-------------F
         +100.0-|
         |      |      +------E
         |      +-73.0-|
  +------|             +------D
  |      |
  |      |             +------A
  |      +-------100.0-|
  |                    +------B
  |
  +---------------------------C
Оно не соответствует тем результатам, которые были получены с помощью 3 методов построения деревьев, а соответствует дереву, полученному с помощью Neighbor-Joining. С реальным деревом по топологии оно не совпадает, поэтому бутстреп-анализ нельзя считать достаточно достоверным. Видно, что две большие ветви определены верно, но на третьей ступени ошибка. В консенсус не была включена правильная ветвь, т.к. она встретилась только в 25 деревьях из 100, а это очень мало.

Изображение филогенетического дерева в графическом формате

Это дерево было нарисовано по заданной скобочной формуле, поэтому оно отражает модель реальных событий.


©Надя Шашина