Реконструкция филогенетических деревьев
Занятие 2. Реконструкция филогенетических деревьев
Таксономический сервис NCBI
Bacillus anthracis....................Bacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group
Clostridium botulinum.............Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
Enterococcus faecalis.............Bacteria; Firmicutes; Bacilli; Lactobacillales; Enterococcaceae; Enterococcus
Geobacillus kaustophilus.........Bacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Geobacillus
Lactobacillus delbrueckii........Bacteria; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
Listeria monocytogenes..........Bacteria; Firmicutes; Bacilli; Bacillales; Listeriaceae; Listeria
Staphylococcus epidermidis...Bacteria; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus
Streptococcus pneumoniae.....Bacteria; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Streptococcus
Поиск в Swiss-Prot
Из списка функций белков была выбрана: Фактор элонгации трансляции 4/LEPA, по белкам соответствующего семейства будет
реконструировано филогенетическое дерево. Из Swiss-Prot были получены
последовательности белков с данной функцией из
отобранных бактерий и выравнены программой muscle и визуализированы в GeneDoc .
Pеконструкция дерева программой fprotpars
Программа выдала одно дерево. Cкобочная формула:
((((LEPA_GEOKA,LEPA_BACAN),(((LEPA_STRPN,LEPA_ENTFA),LEPA_LISMO),LEPA_STAES)),LEPA_CLOB1),LEPA_LACDA);
Изображение деревьев: слева - полученное программой fprotpars, а справа - правильное
Cравнение полученного дерева с правильным
В правильном девере присутствуют ветви, отсутствующие в выдаче программы fprotpars:
1) {LACDA, ENTFA, STRPN} vs {CLOB1, BACAN, GEOKA, LISMO, STAES}
2) {CLOB1, LACDA, ENTFA, STRPN} vs {BACAN, GEOKA, LISMO, STAES}
3) {BACAN, GEOKA, LISMO} vs {CLOB1, LACDA, ENTFA, STRPN, STAES}
В выдаче программы fprotpars присутствуют ветви, отсутствующие в правильном девере:
1) {LEPA CLOB1, LEPA LACDA} vs {LEPA ENTFA, LEPA STRPN, LEPA BACAN, LEPA GEOKA, LEPA LISMO, LEPA STAES}
2) {LEPA ENTFA, LEPA STRPN, LEPA LISMO} vs {LEPA CLOB1, LEPA LACDA, LEPA BACAN, LEPA GEOKA, LEPA STAES}
3) {LEPA ENTFA, LEPA STRPN, LEPA LISMO, LEPA STAES} vs {LEPA CLOB1, LEPA LACDA, LEPA BACAN, LEPA GEOKA}
Эволюционные расстояния между последовательностями
Программой fprotdist была получена матрица расстояний
|
LEPA_LACDA
|
LEPA_CLOB1
|
LEPA_STAES
|
LEPA_BACAN
|
LEPA_GEOKA
|
LEPA_LISMO
|
LEPA_ENTFA
|
LEPA_STRPN
|
LEPA_LACDA
|
0.000000
|
0.571728
|
0.544579
|
0.509776
|
0.488149
|
0.480280
|
0.459744
|
0.485074
|
LEPA_CLOB1
|
0.571728
|
0.000000
|
0.504506
|
0.416720
|
0.387074
|
0.403618
|
0.451756
|
0.481146
|
LEPA_STAES
|
0.544579
|
0.504506
|
0.000000
|
0.307129
|
0.291492
|
0.283476
|
0.293306
|
0.329237
|
LEPA_BACAN
|
0.509776
|
0.416720
|
0.307129
|
0.000000
|
0.174603
|
0.199340
|
0.260083
|
0.278787
|
LEPA_GEOKA
|
0.488149
|
0.387074
|
0.291492
|
0.174603
|
0.000000
|
0.224005
|
0.246539
|
0.272680
|
LEPA_LISMO
|
0.480280
|
0.403618
|
0.283476
|
0.199340
|
0.224005
|
0.000000
|
0.188812
|
0.244084
|
LEPA_ENTFA
|
0.459744
|
0.451756
|
0.293306
|
0.260083
|
0.246539
|
0.188812
|
0.000000
|
0.184502
|
LEPA_STRPN
|
0.485074
|
0.481146
|
0.329237
|
0.278787
|
0.272680
|
0.244084
|
0.184502
|
0.000000
|
Проверка ультраметричности
Так как d(LEPA_LACDA, LEPA_CLOB1) = 0.571728 > d(LEPA_CLOB1, LEPA_STAES) = 0.504506,
то должно выполняться равенство: d(LEPA_LACDA, LEPA_STAES) - d(LEPA_LACDA, LEPA_CLOB1) = 0,
но в данном случае эта разность равна: 0.544579 - 0.571728 = -0,027149 и показывает
отклонение от ультраметричности.
Проверка аддитивности
Из трех сумм:
d(LEPA_LACDA, LEPA_CLOB1) + d(LEPA_STAES, LEPA_BACAN) = 0.571728 + 0.307129 = 0,878857
d(LEPA_LACDA, LEPA_STAES) + d(LEPA_CLOB1, LEPA_BACAN) = 0.544579 + 0.416720 = 0,961299
d(LEPA_LACDA, LEPA_BACAN) + d(LEPA_CLOB1, LEPA_STAES) = 0.509776 + 0.504506 = 1,014282
две должны быть равны и больше третьей: в данном случае две последние суммы больше первой,
но они не равны, и их разность составляет 0,052983 и показывает отклонение от аддитивности.
Реконструкции дерева
Программой fneighbor были оплуччены две реконструкции дерева по двум алгоритмам:
UPGMA, применяемая приусловии справедливости гипотезы молекулярных часов
(матрица расстояний не слишком далека от ультраметрической)(картинка слева),
и Neighbor-Joining (картинка справа), с длинами ветвей при обоих алгоритмах

Общие ветви полученных реконструкций программой fneighbor :
1){LEPA CLOB1, LEPA LACDA} vs {LEPA ENTFA, LEPA STRPN, LEPA BACAN, LEPA GEOKA, LEPA LISMO, LEPA STAES}
(имеется в выдаче программы fprotpars, но но отсутствует в правильном дереве)
2){LEPA ENTFA, LEPA STRPN} vs {LEPA CLOB1, LEPA LACDA, LEPA BACAN, LEPA GEOKA, LEPA LISMO, LEPA STAES}
3){LEPA BACAN, LEPA GEOKA} vs {LEPA CLOB1, LEPA LACDA, LEPA ENTFA, LEPA STRPN, LEPA LISMO, LEPA STAES}
(2-я и 3-я имеются как в выдаче программы fprotpars, так и в правильном дереве)
Ветви, характерные выдаче программы fneighbor только с алгоритмом UPGMA:
1){LEPA BACAN, LEPA GEOKA, LEPA LISMO} vs {LEPA CLOB1, LEPA LACDA, LEPA ENTFA, LEPA STRPN, LEPA STAES}
(имеется еще только в правильном дереве)
2){LEPA CLOB1, LEPA LACDA, LEPA STAES} vs {LEPA ENTFA, LEPA STRPN, LEPA BACAN, LEPA GEOKA, LEPA LISMO}
(выдалось только этой программой с этим алгоритмом)
Ветви, выданные программой fneighbor только с алгоритмом Neighbor-Joining:
1){LEPA ENTFA, LEPA STRPN, LEPA LISMO} vs {LEPA CLOB1, LEPA LACDA, LEPA BACAN, LEPA GEOKA, LEPA STAES}
2){LEPA ENTFA, LEPA STRPN, LEPA LISMO, LEPA STAES} vs {LEPA CLOB1, LEPA LACDA, LEPA BACAN, LEPA GEOKA}
(имееются обе еще и в выдаче программы fprotpars)
Как правильное дерево, так и дерево, полученное программой fneighbor с алгоритмом UPGMA,
выдаются укорененными, в отличие от деревьев, полученных программами fprotpars и fneighbor ,
только с алгоритмом Neighbor-Joining,- они выдаются неукорененными.
©Андреянова Екатерина