Цель занятия: поработать с филогенетическим деревом нескольких бактерий.
На следующих занятиях это дерево будет сравниваться с реконструкциями филогении по последовательностям белков.
Из данного списка бактерий отдела Firmicutes выбираю 7 названий:
| Название | Мнемоника |
| Bacillus subtilis | BACSU |
| Clostridium botulinum | CLOB1 |
| Clostridium tetani | CLOTE |
| Enterococcus faecalis | ENTFA |
| Finegoldia magna | FINM2 |
| Geobacillus kaustophilus | GEOKA |
| Lactobacillus acidophilus | LACAC |
(((CLOTE,CLOB1),FINM2),((LACAC,ENTFA),(BACSU,GEOKA)))
Дерево содержит 4 нетривиальные ветви:
1) {CLOTE, CLOB1} против {FINM2, LACAC, ENTFA, BACSU, GEOKA}
2) {CLOTE, CLOB1, FINM2} против {LACAC, ENTFA, BACSU, GEOKA}
3) {CLOTE, CLOB1, FINM2, BACSU, GEOKA} против {LACAC, ENTFA}
4) {CLOTE, CLOB1, FINM2, LACAC, ENTFA} против {BACSU, GEOKA}
| Название | Таксономическое положение |
| Bacillus subtilis | cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus subtilis group |
| Clostridium botulinum | cellular organisms; Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium |
| Clostridium tetani | cellular organisms; Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium |
| Enterococcus faecalis | cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Enterococcaceae; Enterococcus |
| Finegoldia magna | cellular organisms; Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiales incertae sedis; Clostridiales Family XI. Incertae Sedis; Finegoldia |
| Geobacillus kaustophilus | cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Geobacillus |
| Lactobacillus acidophilus | cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus |
На дереве отобранных бактерий есть ветви, выделяющие таксоны:
1) Ветвь {CLOTE, CLOB1} выделяет Clostridium от остальных.
2) Ветвь {CLOTE, CLOB1, FINM2} выделяет Clostridiales от Bacilli.
3) Ветвь {LACAC, ENTFA} выделяет Lactobacillales от остальных.
4) Ветвь {BACSU, GEOKA} выделяет Bacillaceae от остальных.
Таким образом, легко заметить, что разделение на ветви соответствует таксономическому положению бактерий.
Из данного списка функций белков выбираю одну: Рибосомный белок S2 (RS2). По белкам соответствующего семейства
будем реконструировать филогенетическое дерево.
Для получения выравнивания использую команду muscle -in data.fasta -out datav.fasta.
Вводим команду: fprotpars datav.fasta -outtreefile data.treefile -outfile data.fprotpars.
В результате программа выдала только один вариант дерева: (((RS2_ENTFA,(RS2_BACSU,(RS2_GEOKA,(RS2_CLOTE,RS2_CLOB1)))),RS2_FINM2),RS2_LACAC)
Реконструированное дерево на основе белка RS2 |
Правильное дерево |
Вводим команду: fprotdist datav.fasta -outfile data.fprotdist.
7
RS2_LACAC 0.000000 0.532973 0.473286 0.485131 0.446305 0.468935 0.480286
RS2_FINM2 0.532973 0.000000 0.382930 0.387458 0.551788 0.481519 0.402736
RS2_CLOB1 0.473286 0.382930 0.000000 0.134211 0.389508 0.371016 0.374811
RS2_CLOTE 0.485131 0.387458 0.134211 0.000000 0.413648 0.384315 0.340334
RS2_ENTFA 0.446305 0.551788 0.389508 0.413648 0.000000 0.332305 0.336838
RS2_BACSU 0.468935 0.481519 0.371016 0.384315 0.332305 0.000000 0.122655
RS2_GEOKA 0.480286 0.402736 0.374811 0.340334 0.336838 0.122655 0.000000
Ультраметричность: Рассмотрим тройку {RS2 GEOKA, RS2 CLOTE, RS2 CLOB1}. Видим следующее: если d(GEOKA,CLOB1)=0.374811 > d(CLOB1,CLOTE)=0.134211
(что выполняется), то d(GEOKA,CLOB1)=0.374811 = d(GEOKA,CLOTE)=0.340334 (что не выполняется). Тем не менее расстояния отклоняются от
ультраметричности не на много.
Аддитивность: Рассмотрим четверку {RS2 ENTFA, RS2 GEOKA, RS2 BACSU, RS2_LACAC}. Видим следующее: d(ENTFA,GEOKA)+d(BACSU,LACAC)=0.336838+0.468935=0,805773,
d(ENTFA,LACAC)+d(GEOKA,BACSU)=0.446305+0.122655=0,56896, d(ENTFA,BACSU)+d(GEOKA,LACAC)=0,332305+0.480286=0,812591. Получилось, что две
суммы почти равны между собой и больше третьей, что говорит о выполнении свойства аддитивности.
Neighbor-Joining:
+-------------RS2_FINM2
+--3
! ! +---RS2_CLOB1
! +----2
! +---RS2_CLOTE
!
! +----------RS2_ENTFA
4-5
! ! +---RS2_BACSU
! +-----1
! +--RS2_GEOKA
!
+---------------RS2_LACAC
Неукорененное дерево!
Between And Length
------- --- ------
4 3 0.05061
3 RS2_FINM2 0.23901
3 2 0.07908
2 RS2_CLOB1 0.06337
2 RS2_CLOTE 0.07085
4 5 0.03029
5 RS2_ENTFA 0.17816
5 1 0.09508
1 RS2_BACSU 0.07164
1 RS2_GEOKA 0.05102
4 RS2_LACAC 0.26289
|
UPGMA:
+-------------RS2_LACAC
!
--6 +------------RS2_FINM2
! !
+-5 +---RS2_CLOB1
! +------2
! ! +---RS2_CLOTE
+-4
! +---------RS2_ENTFA
+-3
! +--RS2_BACSU
+------1
+--RS2_GEOKA
From To Length Height
---- -- ------ ------
6 RS2_LACAC 0.24058 0.24058
6 5 0.01993 0.01993
5 RS2_FINM2 0.22064 0.24058
5 4 0.03117 0.05111
4 2 0.12236 0.17347
2 RS2_CLOB1 0.06711 0.24058
2 RS2_CLOTE 0.06711 0.24058
4 3 0.02218 0.07329
3 RS2_ENTFA 0.16729 0.24058
3 1 0.10596 0.17925
1 RS2_BACSU 0.06133 0.24058
1 RS2_GEOKA 0.06133 0.24058
|
Сравниваем эти две реконструкции между собой:
1) Первая реконструкция представляет собой неукорененное дерево в отличие от второй.
2) Нетривиальные ветви:
Neighbor-Joining:
1. {RS2_CLOB1, RS2_CLOTE} против {RS2_FINM2, RS2_ENTFA, RS2_BACSU, RS2_GEOKA, RS2_LACAC}
2. {RS2_CLOB1, RS2_CLOTE, RS2_FINM2} против {RS2_ENTFA, RS2_BACSU, RS2_GEOKA, RS2_LACAC}
3. {RS2_BACSU, RS2_GEOKA} против {RS2_CLOB1, RS2_CLOTE, RS2_FINM2, RS2_ENTFA, RS2_LACAC}
4. {RS2_BACSU, RS2_GEOKA, RS2_ENTFA} против {RS2_CLOB1, RS2_CLOTE, RS2_FINM2, RS2_LACAC}
UPGMA:
1. {RS2_CLOB1, RS2_CLOTE} против {RS2_FINM2, RS2_ENTFA, RS2_BACSU, RS2_GEOKA, RS2_LACAC}
2. {RS2_BACSU, RS2_GEOKA} против {RS2_CLOB1, RS2_CLOTE, RS2_FINM2, RS2_ENTFA, RS2_LACAC}
3. {RS2_BACSU, RS2_GEOKA, RS2_ENTFA} против {RS2_CLOB1, RS2_CLOTE, RS2_FINM2, RS2_LACAC}
4. {RS2_CLOB1, RS2_CLOTE, RS2_FINM2} против {RS2_ENTFA, RS2_BACSU, RS2_GEOKA, RS2_LACAC}
Таким образом, оба дерева имеют одни и теже ветви. С правильным деревом сходятся только 3 из 4-х.
Если сравнивать эти две реконструкции с деревом, полученным программой fprotpars, то реконструкции Neighbor-Joining и UPGMA
являются более достоверными. Как уже отмечалось выше, дерево по fprotpars имеет только 1 общую ветвь с верным.
Теперь рассмотрим оценки расстояний:
Neighbor-Joining:
Ультраметричность: {RS2 GEOKA, RS2 CLOTE, RS2 CLOB1}:
Видим следующее: если d(GEOKA,CLOB1)=0.36945 > d(CLOB1,CLOTE)=0.13422 (что выполняется),
то d(GEOKA,CLOB1)=0.36945 = d(GEOKA,CLOTE)=0.376993 (что можно сказать тоже выполняется).
Таким образом, свойство ультраметричности выполняется.
Аддитивность:
{RS2 ENTFA, RS2 GEOKA, RS2 BACSU, RS2_LACAC}:
Видим следующее: d(ENTFA,GEOKA)+d(BACSU,LACAC)=0.32426+0.4599=0,78416,
d(ENTFA,LACAC)+d(GEOKA,BACSU)=0.47134+0.12266=0,594, d(ENTFA,BACSU)+d(GEOKA,LACAC)=0,34488+0.43928=0,78416.
Получилось, что две суммы абсолютно равны между собой и больше третьей, что говорит о выполнении свойства аддитивности.
UPGMA:
Ультраметричность: {RS2 GEOKA, RS2 CLOTE, RS2 CLOB1}:
Видим следующее: если d(GEOKA,CLOB1)=0.37894 > d(CLOB1,CLOTE)=0.13422 (что выполняется),
то d(GEOKA,CLOB1)=0.37894 = d(GEOKA,CLOTE)=0.37894 (что тоже выполняется).
Таким образом, свойство ультраметричности выполняется.
Аддитивность:
{RS2 ENTFA, RS2 GEOKA, RS2 BACSU, RS2_LACAC}:
Видим следующее: d(ENTFA,GEOKA)+d(BACSU,LACAC)=0.33458+0.48115=0,81573,
d(ENTFA,LACAC)+d(GEOKA,BACSU)=0.48115+0.12266=0,60381, d(ENTFA,BACSU)+d(GEOKA,LACAC)=0,33458+0.48115=0,81573.
Получилось, что две суммы абсолютно равны между собой и больше третьей, что говорит о выполнении свойства аддитивности.
Таким образом, сравнивая эти значения со значениями дерева по fprotpars, ясно видно, что последние две реконструкции
намного вернее.