Моделирование эволюции гена.


1.Создание изображения дерева, описанного заданной мне формулой.




Скобочная формула моего дерева - (((А:45,В:45):5,(С:35,D:35):15):50,(Е:40,F:40):60);
Пользовался графическим редактором Paint.

2.Описание ветвей дерева как разбиений множества листьев (считая дерево бескорневым).

  A B C D E F
  * * . . * *
  * * * * . .
  . . * * * *

Приведено правильное описание топологии приведённого дерева, состоящие всего из трёх строк, отвечающих трём внутренним ветвям.

 

3.Получение искусственных мутантных последовательности, соответствующих листьям и

 узлам дерева, считая, что в корне находится последовательность гена моего белка Glpk_ecoli.


Длина гена белка Glpk_ecoli - 1593 нуклеотидов.
Формула для пересчёта расстояний в число мутаций в гене Glpk: (L/100)*1593, L - длина ветки.

Текст скрипта, которым получаются мутантные последовательности:

msbar glpk.fasta ef.fasta -point 4 -count 956 -auto
msbar ef.fasta f.fasta -point 4 -count 1593 -auto
msbar ef.fasta e.fasta -point 4 -count 1593 -auto
msbar glpk.fasta abcd.fasta -point 4 -count 797 -auto
msbar abcd.fasta ab.fasta -point 4 -count 80 -auto
msbar ab.fasta a.fasta -point 4 -count 717 -auto
msbar ab.fasta b.fasta -point 4 -count 717 -auto
msbar abcd.fasta cd.fasta -point 4 -count 239 -auto
msbar cd.fasta c.fasta -point 4 -count 558 -auto
msbar cd.fasta d.fasta -point 4 -count 558 -auto
cat a.fasta >> ali.fasta  
cat b.fasta >> ali.fasta  
cat c.fasta >> ali.fasta  
cat d.fasta >> ali.fasta  
cat e.fasta >> ali.fasta  
cat f.fasta >> ali.fasta

4.Реконструкция дерева алгоритмами UPGMA, Neighbor-joining и максимального

 правдоподобия.


Поместил последовательности, соответствующие листьям дерева, в один файл в виде "выравнивания" в fasta-формате. Поменял имена последовательностей (программа msbar сохраняет для мутантной последовательности имя, которое имела исходная). Чтобы реконструировать дерево алгоритмом максимального правдоподобия, запустил программу fdnaml:

fdnaml ali.fasta -ttratio 1 -auto

Чтобы реконструировать дерево алгоритмами UPGMA или Neighbor-joining, сначала посчитал попарные расстояния между последовательностями программой fdnadist:

fdnadist ali.fasta -ttratio 1 -auto

После этого файл с расширением .fdnadist подал на вход программе fneighbor для реконструкции алгоритмом Neighbor-joining:

fneighbor ali.fdnadist -auto

Переименовал выходной файл первого запуска и запустил программу еще раз для реконструкции алгоритмом UPGMA:

fneighbor ali.fdnadist -treetype u -auto

Дерево, реконструированное алгоритмом максимального правдоподобия:

 

 

  +-------------B        

  | 

  |                  +-------------F        

  |  +---------------4 

  |  |               +-----------E        

  1--3 

  |  |     +----------D        

  |  +-----2 

  |        +----------C        

  | 

  +------------A        

Дерево, реконструированное алгоритмом Neighbor-joining:

 

  +-------------B        

  !

  !       +----------C        

  ! +-----2

  ! !     +----------D        

  3-4

  ! !                 +------------E        

  ! +-----------------1

  !                   +------------F        

  !

  +------------A        

Дерево, реконструированное алгоритмом UPGMA:

 

 

                      +-------------------------A        

                +-----3

                !     +-------------------------B        

  +-------------4

  !             !          +--------------------C        

  !             +----------1

--5                        +--------------------D        

  !

  !                    +------------------------E        

  +--------------------2

                       +------------------------F        

 

Для сравнение предложено было сделать таблицу, в левой части которой приведены (в виде точек и звёздочек) все ветви, встреченные во всех деревьях (исходном и трёх реконструкциях), а в правой добавлены четыре столбца, соостветствующие четырём деревьям. Знаком + отмечено, в каких деревьях встретилась каждая из ветвей.

A

B

C

D

E

F

правильное дерево

1ое

2ое

*

*

.

.

*

*

+

+

+

+

*

*

*

*

.

.

+

+

+

+

.

.

*

*

*

*

+

+

+

+

 

Дерево, реконструированное алгоритмом максимального правдоподобия, оказалось таким же как и дерево, реконструированное алгоритмом Neighbor-joining. Дерево, реконструированное алгоритмом UPGMA, оказалось одинаковым с исходным деревом.

 

 


На главную страницу четвертого семестра

На главную


© Кузеванов Алексей,2005