Моделирование эволюции гена

 

    Было предложено смоделировать эволюцию гена по заданной скобочной формуле.

    (((A:33,B:33):27,((C:37,D:37):13,E:50):10):40,F:100);

    На основе этой формулы было построено филогенетическое дерево, листья обозначены большими латинскими буквами, эволюционные расстояния указаны  в количествах мутаций на 100 нуклеотидов.

Рис. 1. Филогенетическое дерево, построенное по скобочной формуле.

    Считая дерево неукоренённым, ветви, как разбиения множества листьев, были отображены в таблице.

A B C D E F
* * . . . .
. . * * * .
. . * * . .

Создание искусственных мутантных последовательностей

    Затем были созданы искуственные мутантные последовательности, соответствующие листьям и узлам дерева, считая, что в корне находится последовательность гена белка GLK_ECOLI.

Длина гена равна 966 нуклеотидов.

Поэтому формула для пересчёта расстояний в число мутаций гена:

X = x * 966/100,

где x - эволюционное расстояние.

    Для построения мутантных последовательностей был создан скрипт:

msbar GLK.fasta F -point 4 -count 966 -auto
msbar GLK.fasta ABECD -point 4 -count 386 -auto
msbar ABECD AB -point 4 -count 261 -auto
msbar AB A -point 4 -count 319 -auto
msbar AB B -point 4 -count 319 -auto
msbar ABECD ECD -point 4 -count 97 -auto
msbar ECD E -point 4 -count 483 -auto
msbar ECD CD -point 4 -count 126 -auto
msbar CD C -point 4 -count 357 -auto
msbar CD D -point 4 -count 357 -auto
cat A >> X
cat B >> X
cat C >> X
cat D >> X
cat E >> X
cat F >> X
.

 

Реконструирование филогенетического дерева

    На основе последовательностей, соответствующих листьям, было реконструировано филогенетическое дерево алгоритмами максимального правдоподобия, UPGMA и Neighbor-joining.

Максимальное правдоподобие

  +------B        
  | 
  |       +-----------E        
  1-------3 
  |       |  +-----------------------------------F        
  |       +-4 
  |          |  +------D        
  |          +-2 
  |             +---------C        
  | 
  +-----A

 

UPGMA

                                      +-------------A        
                        +------------1
                        !             +-------------B        
  +--------------------4
  !                     !          +----------------C        
  !                     !  +------2
--5                     +-3       +----------------D        
  !                        !
  !                        +------------------------E        
  !
 
+-------------------------------------------------F

 

Neighbor-joining

  +------B        
  !
  !       +------------E        
  !       !
  1-------3   +----------C        
  !       ! +2
  !       +4 +------D        
  !         !
  !         +-----------------------------------F        
  !
  +-----A

 

   Исходное дерево и 3 реконструированных дерева можно сравнить по таблице. Слева приведены ветви, встреченные в исследуемых деревьях, а справа приведены столбцы, соответствующие этим деревьям, с отмеченными ветвями, которые встретились в каждом из деревьев.

  

A

B

C

D

E

F

Исходное дерево

Максимальное Правдоподобие

UPGMA

Neighbor-joining

.

.

*

*

.

.

*

*

*

*

*

*

.

.

.

.

*

*

*

*

.

.

*

*

*

.

*

 -

*

.

.

*

*

.

*

 -

*

*

 

   Реконструкция филогенетического дерева методом UPGMA дала дерево с такой же топологией, что и у исходного. А методы максимального правдоподобия и Neighbor-joining реконструировали деревья, отличные от исходного на одну ветвь.

   Вывод: для решения данной задачи реконструкции филогенетического дерева предпочтительным методом является UPGMA.

 

bootstrap и drawtree

    Программой fseqboot было создано 100 бутстреп-реплик выравнивания.

    Затем полученные 100 выравниваний были обработаны программой fdnaml, которая построила 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний.

    Затем программой fconsense были получены результаты бутстреп-анализа.

     У полученного консенсусного и исходного филогенетических деревьев совпадают две ветви, а одна не совпадает. Причём совпадающие две ветви были реконструированы во всех исследуемых деревьях.

 
                       +------A
                +100.0-|
         +-48.0-|      +------B
         |      |
  +------|      +-------------E
  |      |
  |      |             +------D
  |      +--------76.0-|
  |                    +------C
  |
  +---------------------------F

 

   Бутстреп-значения консенсусного дерева.

A B C D E F
* * . . . .   100.00
* * . . * .   48.00
. . * * . .   76.00

 

   Бутстреп-значения исходного дерева.

A B C D E F
* * . . . .   100.00
. . * * * .
   40.00
. . * * . .
   76.00

 

  Разбиение дерева AB и EFCD является надёжным, бутстреп-значение равно 100.
  Разбиение дерева CD и FEAB тоже достаточно надёжно, бутстреп-значение равно 76, присутствует в исходном дереве.
  Разбиение дерева FCD и ABE с бутстреп-значением 48 не надёжно, его нет в исходном дереве.

  Надёжными разбиениями дерева оказались те, бутстреп-значения которых больше 50.

 

    Посредством программы drawtree было получено изображение исходного дерева по исходной скобочной формуле.


Рис. 2. Изображение исходного дерева, построенное программой drawtree.



На главную страницу четвёртого семестра


©Дмитрий