Деревья


Построение дерева по алгоритму UPGMA

Для выполнения этого задания я пользвался выравниванием файла benchmark.msf

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

2

0

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

4

0

 

 

 

 

 

 

 

 

 

  

G

L

P

K

_

E

C

O

L

I

 

:

 

Q

N

T

N

G

V

Y

V

V

P

A

F

T

G

L

G

A

P

Y

W

D

P

Y

A

R

G

A

I

F

G

L

T

R

G

V

N

A

N

H

I

I

R

A

T

L

 

:

 

45

G

N

T

K

_

B

A

C

L

I

 

:

 

P

G

A

D

G

L

L

F

H

P

Y

L

A

G

E

R

A

P

L

W

N

P

D

V

P

G

S

F

F

G

L

T

M

S

H

K

K

E

H

M

I

R

A

A

L

 

:

 

45

G

L

P

K

_

B

A

C

S

U

 

:

 

D

S

T

D

G

V

Y

V

V

P

A

F

V

G

L

G

T

P

Y

W

D

S

D

V

R

G

S

V

F

G

L

T

R

G

T

T

K

E

H

F

I

R

A

T

L

 

:

 

45

X

Y

L

B

_

L

A

C

P

E

 

:

 

I

G

A

N

G

L

L

F

A

P

Y

I

V

G

E

R

A

P

Y

A

D

A

T

I

R

G

S

F

I

G

V

D

G

S

H

Q

R

A

D

F

V

R

A

V

L

 

:

 

45

L

Y

X

K

_

H

A

E

I

N

 

:

 

P

A

S

S

S

V

L

F

A

P

F

L

Y

G

S

N

A

K

L

G

M

Q

A

G

-

-

-

F

Y

G

I

Q

S

H

H

T

Q

I

H

L

L

Q

A

I

Y

 

:

 

42

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

6

 

 

 

P

 

 

 

G

 

 

a

p

 

 

 

 

 

 

 

g

 

 

 

G

6

 

 

 

 

 

 

 

h

 

6

r

A

 

l

 

 

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

6

0

 

 

 

 

 

 

 

 

 

 

 

 

G

L

P

K

_

E

C

O

L

I

 

:

 

E

S

I

A

Y

Q

T

R

D

V

L

E

A

M

Q

A

D

S

G

I

R

 

:

 

6

6

G

N

T

K

_

B

A

C

L

I

 

:

 

E

G

V

I

Y

N

L

Y

T

V

F

L

A

L

T

E

C

M

D

G

P

 

:

 

6

6

G

L

P

K

_

B

A

C

S

U

 

:

 

E

S

L

A

Y

Q

T

K

D

V

L

D

A

M

E

A

D

S

N

I

S

 

:

 

6

6

X

Y

L

B

_

L

A

C

P

E

 

:

 

E

G

I

I

F

S

F

E

D

L

I

K

L

Y

Q

H

N

-

G

A

E

 

:

 

6

5

L

Y

X

K

_

H

A

E

I

N

 

:

 

E

G

V

I

F

S

L

M

S

H

L

E

R

M

Q

V

R

-

F

P

N

 

:

 

6

2

 

 

 

 

 

 

 

 

 

 

 

 

 

E

 

6

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Cоздал книгу: UPGMA.xls , где построил матрицу эволюционных расстояний между последовательностями выравнивания По тому, что было сказано в задании посчитал эволюционные расстояния (D) величины D = 100 – P, где P — % идентичности. Составил матрицу попарных совпадений есть также на листе: Расстояния . Рядом создал матрицу попарных эволюционных расстояний.

Постройка дерева:  скопировал матрицу попарных эволюционных расстояний на новый лист, и назвал лист "UPGMA". Выделил минимальное расстояние в матрице. Создал новую таблицу, в которой ближайшие последовательности объединены в один кластер (расстояния от нового кластера до каждой из оставшихся последовательностей  вычислены как среднее расстояние до объединенных последовательностей).
Скобочная структура:((((GLPK_BACSU:16,GLPK_ECOLI:16):1.25,GNTK_BACLI:17.25)

:7.125,XYLB_LACPE:24.375):6.8125,LYXK_HAEIN:31.1875);

Сравнение двух изображений дерева, построенных по алгоритму UPGMA.

 

 


Получил два графических файла с помощью программ drawtree и drawgraм. Программа drawtree выдает нам своего рода рисунок - а программа drawgram выдает диаграммированную схему

Предположительный сценарий эволюции

Согласно полученным данным, GLPK_BACSU и GLPK_ECOLI имеют общего предка "A", а этот предок и GNTK_BACLI имеют общего предка "В", который в свою очередь имеет гипотетически общего предка с XYLB_LACPE, который имеет общего предка “C”с LYXK_HAEIN.

Дерево, построенное по методу ближайших соседей

Скобочную структура:

(((GLPK_ECOLI:0.15869,GLPK_BACSU:0.15949):0.22182,GNTK_BACLI:0.27061)

:0.02095,XYLB_LACPE:0.32252,LYXK_HAEIN:0.41942);
 

 

 

Сравнение деревьев показывает, что неукорененные деревья совпадают в своей топологии, но сильно различаются в длине ветвей. Топология неукорененных деревьев различается только в области близкой к самому корню. Длины ветвей также различны. Так как NJ-алгоритм строит по сути неукорененное дерево, смысл построенного программой drawtree дерева под вопросом. Согласно укорененному дереву, построенному по алгоритму UPGMA, эволюция домена шла следующим образом: от единой эволюционной линии последовательно отходят ветви, в конеченом итоге породившие белки: LYXK_HAEIN, XYLB_LACPE, GNTK_BACLI, GLPK_ECOLI, GLPK_BACSU (упомянуты в порядке отщепления).

Есть незначительные отличия в сценариях эволюции. По моему второй метод быстрее (меньше программ и более понятно.) Но, конечно, эволюция прослеживается труднее.

 


На главную страницу второго семестра

На главную


© Кузеванов Алексей,2005