Что такое филогенетическое дерево

Список выбранных бактерий:
НазваниеМнемоника
Bacillus subtilisBACSU
Clostridium tetanCLOTE
Enterococcus faecalisENTFA
Geobacillus kaustophilusGEOKA
Lactobacillus acidophilusLACAC
Lactobacillus delbrueckiiLACDA
Listeria monocytogenesLISMO
Staphylococcus epidermidisSTAES

  1. Cкобочная формула
    (((((BACSU, GEOKA), LISMO), STAES), ((LACDA, LACAC), ENTFA)), CLOTE);
  2. Изображение:
  3. Cписок нетривиальных ветвей как разбиений множества листьев
    1.{BACSU, GEOKA} vs {LISMO, STAES, LACDA, LACAC, ENTFA, CLOTE};
    2.{BACSU, GEOKA, LISMO} vs { STAES, LACDA, LACAC, ENTFA, CLOTE};
    3.{BACSU, GEOKA, LISMO, STAES} vs { LACDA, LACAC, ENTFA, CLOTE};
    4.{LACDA, LACAC} vs {BACSU, GEOKA, LISMO, STAES, ENTFA, CLOTE};
    5.{LACDA, LACAC, ENTFA} vs {BACSU, GEOKA, LISMO, STAES, CLOTE};

Реконструкция филогенетических деревьев

  1. Таксономия выбранных мной бактерий, найденная с помощью таксономического сервиса NCBI http://www.ncbi.nlm.nih.gov/taxonomy/:

    Bacillus subtilis :
    cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Bacillus;
    Clostridium tetan :
    cellular organisms; Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
    Enterococcus faecalis:
    cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Enterococcaceae; Enterococcus
    Geobacillus kaustophilus:
    cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Geobacillus
    Lactobacillus acidophilus:
    cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
    Lactobacillus delbrueckii:
    cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
    Listeria monocytogenes:
    cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Listeriaceae; Listeria
    Staphylococcus epidermidis:
    cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus

    Первая ветка соответствует таксону Bacillaceae, третья – Bacillales, четвертая- Lactobacillus а пятая - Lactobacillales. Втора ветвь ничего существенного не отделяет.

    Я выбрала семейство белков LEPA (Фактор элонгации трансляции 4) и создавала выравнивание с помощью программы muscle

  2. Скобочная формула дерева, созданного программой fprotpars(программа выдала только одно дерево):
    (((((((LISMO,ENTFA),STAES),BACSU),GEOKA),CLOTE),LACDA),LACAC);
  3. Изображение :

    Замечание: У этого дерева с "правильным" совпадает только одна ветвь -
    {LACDA, LACAC} vs {BACSU, GEOKA, LISMO, STAES, ENTFA, CLOTE};
  4. Матрица расстояний, полученная программой fprotdist:
    --------------LACAC------LACDA------CLOTE------STAES------ENTFA------LISMO------BACSU------GEOKA---
    LACAC0.0000000.1209650.5912300.5293880.4083040.4720160.4700130.437770
    LACDA0.1209650.0000000.6073780.5445790.4597440.4802800.4755930.488149
    CLOTE0.5912300.6073780.0000000.5740390.4773610.4483400.4271360.391489
    STAES0.5293880.5445790.5740390.0000000.2933060.2834760.2812720.291492
    ENTFA0.4083040.4597440.4773610.2933060.0000000.1888120.2500320.246539
    LISMO0.4720160.4802800.4483400.2834760.1888120.0000000.1741790.224005
    BACSU0.4700130.4755930.4271360.2812720.2500320.1741790.0000000.169548
    GEOKA0.4377700.4881490.3914890.2914920.2465390.2240050.1695480.000000

    Оценка ультрамеричности:
    • LACAC=A, LISMO=B, BACSU=C
      d(A,C)=0.470013; d(A,B)=0.472016; d(B,C)=0.174179;
      в(A,C) практически равно d(A,B) (отклонение на 0.002003) и эти расстояния больше третьего
    • ENTFA=A, LACAC=B, LACDA=C
      d(A,C)=0.459744; d(A,B)=0.408304; d(B,C)=0.120965;
      В этом случае отклонение от ультрамеричности больше (d(A,C) отличается от d(A,B) больше, чем на 0.05)

    Оценка аддитивности:
    • GEOKA=A, LACAC=B, LACDA=C, CLOTE=В
      d(A,B)+d(C,D)=1.045148;
      d(A,C)+d(B,D)=1.079379;
      d(A,D)+d(C,B)=0.512454;
      Две суммы из трех почти равны и больше третьей
  5. Деревья, построенные программой fneighbor
    Алгоритм Neighbor-Joining

    Алгоритм UPGMA
  6. Сравнение деревьев
    Деревья, полученные с помощью алгоритмов Neighbor-Joining и UPGMA совпадают тремя ветвями:
    {LACAC, LACDA} vs {CLOTE, STAES, ENTFA, LISMO, BACSU, GEOKA};
    {LACAC, LACDA, CLOTE} vs {STAES, ENTFA, LISMO, BACSU, GEOKA};
    {ENTFA, LISMO} vs {CLOTE, STAES, LACAC, LACDA, BACSU, GEOKA};
    При этом неукорененное дерево ( алгоритм Neighbor-Joining) совпадает с "правильным" только одной ветвью
    {LACAC, LACDA} vs {CLOTE, STAES, ENTFA, LISMO, BACSU, GEOKA};
    А укорененное - двумя
    {LACAC, LACDA} vs {CLOTE, STAES, ENTFA, LISMO, BACSU, GEOKA};
    {BACSU, GEOKA} vs {CLOTE, STAES, ENTFA, LISMO, LACAC, LACDA};
    Получилось, что программа fneighbor в данном случае не намного точнее, чем fprotpars.