Tree
Филогенетические деревья, реконструированные разными способами
"Эталонное" множественное выравнивание доменов CoaE (идентификатора семейства - PF01121), взятых из белка COAE_ECOLI и четырех его
гомологов (с процентамми идентичности от 53 до 88):
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
2 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
4 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
8 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
Y |
N |
P |
5 |
_ |
C |
A |
E |
E |
L |
  |
: |
  |
L |
V |
V |
G |
L |
S |
G |
G |
V |
A |
T |
G |
K |
S |
T |
V |
S |
S |
V |
F |
R |
A |
- |
H |
G |
V |
P |
I |
I |
D |
A |
D |
Q |
V |
A |
R |
Q |
V |
V |
V |
P |
G |
T |
S |
T |
Y |
N |
R |
L |
R |
K |
E |
F |
G |
- |
- |
- |
D |
E |
Y |
F |
D |
D |
E |
H |
G |
G |
V |
L |
R |
R |
D |
K |
L |
G |
K |
L |
I |
F |
S |
N |
P |
E |
  |
: |
  |
  |
7 |
9 |
Y |
D |
9 |
6 |
_ |
Y |
E |
A |
S |
T |
  |
: |
  |
L |
V |
V |
G |
L |
T |
G |
G |
I |
A |
C |
G |
K |
S |
T |
V |
S |
R |
R |
L |
R |
D |
K |
Y |
K |
L |
P |
I |
V |
D |
A |
D |
K |
I |
A |
R |
Q |
V |
V |
E |
P |
G |
Q |
N |
A |
Y |
D |
Q |
I |
V |
L |
Y |
F |
K |
D |
K |
I |
P |
N |
L |
L |
L |
E |
D |
- |
- |
G |
H |
L |
N |
R |
E |
A |
L |
G |
K |
W |
V |
F |
S |
H |
K |
E |
  |
: |
  |
  |
8 |
1 |
C |
O |
A |
E |
_ |
E |
C |
O |
L |
I |
  |
: |
  |
Y |
I |
V |
A |
L |
T |
G |
G |
I |
G |
S |
G |
K |
S |
T |
V |
A |
N |
A |
F |
A |
D |
- |
L |
G |
I |
N |
V |
I |
D |
A |
D |
I |
I |
A |
R |
Q |
V |
V |
E |
P |
G |
A |
P |
A |
L |
H |
A |
I |
A |
D |
H |
F |
G |
- |
- |
- |
A |
N |
M |
I |
A |
A |
D |
- |
- |
G |
T |
L |
Q |
R |
R |
A |
L |
R |
E |
R |
I |
F |
A |
N |
P |
E |
  |
: |
  |
  |
7 |
7 |
C |
O |
A |
E |
_ |
A |
E |
R |
H |
Y |
  |
: |
  |
Y |
V |
V |
A |
I |
T |
G |
G |
I |
G |
S |
G |
K |
T |
T |
I |
A |
N |
Q |
F |
A |
E |
- |
L |
G |
I |
D |
V |
V |
D |
A |
D |
V |
I |
A |
R |
E |
V |
V |
E |
P |
G |
A |
P |
A |
L |
A |
A |
I |
A |
A |
H |
F |
G |
- |
- |
- |
P |
D |
V |
I |
A |
A |
D |
- |
- |
G |
Q |
L |
D |
R |
R |
S |
L |
R |
E |
R |
V |
F |
S |
D |
P |
D |
  |
: |
  |
  |
7 |
7 |
C |
O |
A |
E |
_ |
N |
E |
I |
G |
O |
  |
: |
  |
A |
W |
V |
G |
L |
T |
G |
G |
I |
G |
S |
G |
K |
S |
A |
A |
A |
Q |
Y |
F |
A |
D |
- |
L |
R |
V |
P |
R |
I |
D |
A |
D |
R |
A |
A |
H |
S |
L |
T |
A |
S |
D |
G |
I |
A |
L |
P |
E |
I |
R |
R |
L |
F |
G |
- |
- |
- |
D |
T |
V |
F |
D |
T |
Q |
- |
- |
G |
L |
L |
R |
R |
D |
I |
L |
R |
K |
E |
I |
F |
A |
S |
P |
S |
  |
: |
  |
  |
7 |
7 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
V |
  |
6 |
3 |
G |
G |
6 |
  |
  |
G |
K |
3 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
  |
  |
6 |
D |
A |
D |
  |
  |
A |
  |
  |
6 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
  |
  |
  |
F |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
G |
  |
L |
  |
R |
  |
  |
L |
  |
  |
  |
6 |
F |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
1 |
0 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
1 |
2 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
1 |
4 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
1 |
6 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
Y |
N |
P |
5 |
_ |
C |
A |
E |
E |
L |
  |
: |
  |
K |
R |
K |
A |
L |
N |
G |
I |
T |
H |
P |
A |
I |
R |
W |
E |
M |
F |
K |
Q |
F |
L |
T |
L |
L |
I |
T |
G |
T |
K |
Y |
I |
V |
F |
D |
T |
P |
L |
L |
F |
E |
S |
- |
G |
Y |
D |
K |
W |
I |
G |
T |
T |
I |
V |
V |
W |
C |
D |
F |
E |
Q |
E |
V |
E |
R |
M |
V |
T |
R |
D |
- |
N |
I |
S |
R |
A |
D |
A |
E |
S |
R |
I |
H |
  |
: |
  |
1 |
6 |
0 |
Y |
D |
9 |
6 |
_ |
Y |
E |
A |
S |
T |
  |
: |
  |
D |
L |
Q |
A |
L |
N |
G |
I |
T |
H |
P |
A |
I |
R |
Y |
A |
M |
F |
K |
E |
I |
G |
Y |
Y |
Y |
L |
K |
G |
Y |
R |
M |
C |
V |
L |
D |
V |
P |
L |
L |
F |
E |
G |
- |
N |
L |
D |
S |
I |
C |
G |
V |
T |
V |
S |
V |
I |
C |
T |
Q |
E |
L |
Q |
L |
E |
R |
L |
M |
T |
R |
N |
P |
E |
L |
S |
E |
E |
D |
A |
K |
N |
R |
L |
N |
  |
: |
  |
1 |
6 |
3 |
C |
O |
A |
E |
_ |
E |
C |
O |
L |
I |
  |
: |
  |
E |
K |
N |
W |
L |
N |
A |
L |
L |
H |
P |
L |
I |
Q |
Q |
E |
T |
Q |
H |
Q |
I |
Q |
Q |
A |
T |
S |
- |
- |
- |
P |
Y |
V |
L |
W |
V |
V |
P |
L |
L |
V |
E |
N |
- |
S |
L |
Y |
K |
K |
A |
N |
R |
V |
L |
V |
V |
D |
V |
S |
P |
E |
T |
Q |
L |
K |
R |
T |
M |
Q |
R |
D |
- |
D |
V |
T |
R |
E |
H |
V |
E |
Q |
I |
L |
A |
  |
: |
  |
1 |
5 |
5 |
C |
O |
A |
E |
_ |
A |
E |
R |
H |
Y |
  |
: |
  |
A |
K |
V |
W |
L |
N |
A |
L |
L |
H |
P |
L |
I |
R |
Q |
E |
M |
F |
G |
R |
C |
A |
A |
A |
H |
S |
- |
- |
- |
P |
Y |
C |
L |
L |
V |
V |
P |
L |
L |
V |
E |
N |
- |
K |
L |
T |
G |
L |
A |
N |
R |
V |
L |
V |
I |
D |
V |
D |
E |
A |
T |
Q |
I |
E |
R |
T |
C |
R |
R |
D |
- |
G |
V |
S |
R |
E |
Q |
V |
Q |
A |
I |
L |
A |
  |
: |
  |
1 |
5 |
5 |
C |
O |
A |
E |
_ |
N |
E |
I |
G |
O |
  |
: |
  |
R |
K |
A |
L |
L |
E |
S |
V |
M |
L |
P |
L |
I |
F |
S |
E |
I |
K |
K |
Q |
Q |
E |
T |
F |
T |
D |
A |
- |
- |
V |
Y |
G |
I |
V |
E |
I |
P |
L |
L |
T |
E |
K |
R |
Q |
F |
I |
S |
L |
I |
R |
R |
V |
L |
T |
I |
S |
A |
P |
L |
E |
K |
R |
I |
G |
R |
V |
M |
A |
R |
S |
- |
G |
L |
T |
R |
G |
E |
V |
A |
D |
I |
I |
S |
  |
: |
  |
1 |
5 |
7 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
L |
  |
  |
6 |
  |
  |
P |
  |
I |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
  |
  |
  |
P |
L |
L |
  |
E |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
  |
6 |
  |
  |
  |
  |
  |
  |
  |
6 |
  |
R |
  |
  |
  |
R |
  |
  |
  |
6 |
3 |
  |
  |
  |
  |
  |
  |
  |
6 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
1 |
8 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
Y |
N |
P |
5 |
_ |
C |
A |
E |
E |
L |
  |
: |
  |
A |
Q |
M |
D |
I |
E |
E |
K |
K |
K |
R |
A |
K |
I |
V |
I |
D |
N |
N |
G |
N |
I |
D |
E |
  |
: |
  |
1 |
8 |
4 |
Y |
D |
9 |
6 |
_ |
Y |
E |
A |
S |
T |
  |
: |
  |
S |
Q |
M |
S |
T |
E |
E |
R |
M |
A |
R |
S |
D |
Y |
I |
L |
Q |
N |
N |
S |
T |
L |
V |
D |
  |
: |
  |
1 |
8 |
7 |
C |
O |
A |
E |
_ |
E |
C |
O |
L |
I |
  |
: |
  |
A |
Q |
A |
T |
R |
E |
A |
R |
L |
A |
V |
A |
D |
D |
V |
I |
D |
N |
- |
N |
G |
A |
P |
D |
  |
: |
  |
1 |
7 |
8 |
C |
O |
A |
E |
_ |
A |
E |
R |
H |
Y |
  |
: |
  |
A |
Q |
A |
S |
R |
A |
E |
R |
L |
A |
A |
A |
D |
D |
V |
L |
D |
N |
K |
N |
G |
A |
P |
E |
  |
: |
  |
1 |
7 |
9 |
C |
O |
A |
E |
_ |
N |
E |
I |
G |
O |
  |
: |
  |
H |
Q |
A |
S |
E |
S |
E |
R |
L |
L |
L |
A |
D |
D |
V |
L |
L |
N |
D |
G |
S |
L |
K |
S |
  |
: |
  |
1 |
8 |
1 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
Q |
  |
  |
  |
  |
  |
4 |
  |
  |
  |
  |
  |
  |
6 |
6 |
  |
N |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
|
I. Построение деревьев по алгоритму UPGMA
В ходе работы был создан документ UPGMA.xls.
- На листе "Distances" представлены две матрицы: матрица попарных совпадений,
полученная с помощью программы GeneDoc из множественного выравнивания, которое
можно видеть выше; и матрица попарных эволюционных расстояний, полученная из первой.
Значения для второй матрицы находились по формуле:
D = 100 - P,
где P - процент идентичности, а D - эволюционное расстояние.
- На листе "UPGMA" приведены шаги создания дерева и попутно с ним правильной скобочной
формулы. Красным цветом выделены наименьшие расстояния, которые послужат для объединения двух
белков в кластер при следующем шаге, другими цветами обозначены объединяемые на
следующем шаге белки и образованные ими кластеры.
- В итоге по шагам была построена правильная скобочная формула:
(((COAE_ECOLI:16.5, COAE_AERHY:16.5):15.5, COAE_NEIGO:32):3, (YNP5_CAEEL:29, YD196_YEAS:29):6);
II. Сравнение изображений построенного UPGMA-дерева
Для визуализации дерева по его правильной скобочной формуле (см. выше) были использованы
программы
drawtree и
drawgram из Online-версии пакета Phylip.
Основным отличием данных деревьев является то, что дерево слева - неукорененное, то есть
мы вообще не можем сказать кто был предком и в какой части дерева он находится.
Дерево справа предполагает, что сначала был какой-то один белок-прародителяь,
которого эволюция привела к пяти различным формам. Мое представление о дереве
лучше отражает изображение справа, так как там, на мой взгляд, более удачно
показан ход и время эволюционного процесса: от гипотетического предка произошли
две опять-таки гипотетических последовательности; одна стала предком двух современных -
YNP5_CAEEL и YD96_YEAST; другая в процессе эволюции разделилась на современную
последовательность COAE_NEIGO и предка двух современных COAE_ECOLI и COAE_AERHY
последовательностей.
III. Получение и описание дерева, построенного по методу ближайших соседей (NJ-дерево)
Выравнивание CoaE.msf было приведено к fasta-формату, а затем с помощью
программы emma было построено множественное выравнивание. Также в выдаче мы
получили руководящее дерево (guide tree) в файле NJ.dnd, в котором при просмотре
через FAR можно видеть другую скобочную формулу:
((YNP5_CAEEL:0.27375, YD96_YEAST:0.28603):0.09115, (COAE_ECOLI:0.15446, COAE_AERHY:0.17138):0.12008, COAE_NEIGO:0.34443);
С помощью этой формулы, а также программ
drawtree и
drawgram были построены нижеследующие деревья.
Сравнение данных изображений такое же, что и предыдущих. Можно еще добавить, что
изображение дерева справа - в неультраметрическом пространстве. Но здесь лучше отражает
мое представление о дереве изображение слева, так как в изображении справа предполагается,
что от гипотетической предковой последовательности произошли три (!) последовательности,
две из которых в свою очередь расщепились каждая еще на две. Таким образом,
сценарий эволюции при реконструировании дерева разными методами (по правым
изображениям обоих деревьев) различен. По левым же изображениям нельзя описать
сценарий эволюции, так как они показывает лишь связь между кластерами. По этой
причине левые изображения дерева при реконструкции разными способами получились
идентичными.
©Куликовский, Алексей