1. Отобранные виды семейства Firmicutes

Название Мнемоника
Bacillus anthracis BACAN
Clostridium tetani CLOTE
Enterococcus faecalis ENTFA
Finegoldia magna FINM2
Lactobacillus delbrueckii LACDA
Lactococcus lactis LACLM
Listeria monocytogenes LISMO
Staphylococcus epidermidis STAES

2. Скобочная формула

((CLOTE, FINM2), (((ENTFA, LACLM), LACDA), ((BACAN, LISMO), STAES)))

3. Изображение Филогенетического дерева

4. Нетривиальные ветви

  • {CLOTE, FINM2} vs {ENTFA, LACLM, LACDA, BACAN, LISMO, STAES}
  • {ENTFA, LACLM} vs {CLOTE, FINM2, LACDA, BACAN, LISMO, STAES}
  • {BACAN, LISMO} vs {CLOTE, FINM2, ENTFA, LACLM, LACDA, STAES}
  • {ENTFA, LACLM, LACDA} vs {CLOTE, FINM2, BACAN, LISMO, STAES}
  • {BACAN, LISMO, STAES} vs {CLOTE, FINM2, ENTFA, LACLM, LACDA}

    1.

    Название Мнемоника
    Bacillus anthracis cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group
    Clostridium tetani cellular organisms; Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiaceae; Clostridium
    Enterococcus faecalis cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Enterococcaceae; Enterococcus
    Finegoldia magna cellular organisms; Bacteria; Firmicutes; Clostridia; Clostridiales; Clostridiales incertae sedis; Clostridiales Family XI. Incertae Sedis; Finegoldia
    Lactobacillus delbrueckii cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
    Lactococcus lactis cellular organisms; Bacteria; Firmicutes; Bacilli; Lactobacillales; Streptococcaceae; Lactococcus
    Listeria monocytogenes cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Listeriaceae; Listeria
    Staphylococcus epidermidis cellular organisms; Bacteria; Firmicutes; Bacilli; Bacillales; Staphylococcaceae; Staphylococcus

  • 2.

    Выбрал функцию - рибосомальный белок R2.
    Для получения последовательностей белков составил список ID и подал его на вход сервису retrieve на сайте UniProt.

    3.

    Создал выравнивание отобранных белков программой mafft.

    4 (дополнительное).

    Выравнивание

    5. fprotpars

    Программа выдала лишь одно дерево:
            +--------------RS2_LISMO 
         +--6  
         !  !  +-----------RS2_STAES 
         !  +--7  
         !     !  +--------RS2_FINM2 
         !     +--3  
      +--2        !  +-----RS2_LACDA 
      !  !        +--4  
      !  !           !  +--RS2_LACLM 
      !  !           +--5  
      1  !              +--RS2_ENTFA 
      !  !  
      !  +-----------------RS2_CLOTE 
      !  
      +--------------------RS2_BACAN 
    
    Его скобочная формула:
    (((((((RS2_LACLM, RS2_ENTFA), RS2_LACDA), RS2_FINM2), RS2_STAES), RS2_LISMO), RS2_CLOTE), RS2_BACAN)
    В полученном дереве лишь клада 4 совпадает с реальностью. Все попытки как-то укоренить это дерево, чтобы оно совпало с правильным становятся тщетными. В нем нет ветви отделяющей CLOTE и FINM2 от остальных, аналогично и клада ((BACAN, LISMO), STAES) со своими ветвями не определяема в выданном дереве.

    6. fprotdist

    RS2_BACAN   0.000000  0.352891  0.295251  0.397747  0.419908  0.382330  0.184069  0.242151
    RS2_CLOTE   0.352891  0.000000  0.422336  0.390700  0.486929  0.421259  0.360844  0.392291
    RS2_ENTFA   0.295251  0.422336  0.000000  0.551788  0.369588  0.254410  0.336172  0.436504
    RS2_FINM2   0.397747  0.390700  0.551788  0.000000  0.505670  0.531117  0.493917  0.550807
    RS2_LACDA   0.419908  0.486929  0.369588  0.505670  0.000000  0.370076  0.512328  0.548624
    RS2_LACLM   0.382330  0.421259  0.254410  0.531117  0.370076  0.000000  0.439996  0.471129
    RS2_LISMO   0.184069  0.360844  0.336172  0.493917  0.512328  0.439996  0.000000  0.335770
    RS2_STAES   0.242151  0.392291  0.436504  0.550807  0.548624  0.471129  0.335770  0.000000
    
    		Аксиома ультраметричности может выполняться (даже на 6 сотых)
    d(RS2_BACAN, RS2_CLOTE) < max[d(RS2_BACAN, RS2_ENTFA); d(RS2_CLOTE, RS2_ENTFA)]
    	0.352891			0.295251			0.422336
    		или нет (на 5 сотых)
    d(RS2_LACDA, RS2_BACAN) > max[d(RS2_ENTFA, RS2_BACAN); d(RS2_LACDA, RS2_ENTFA)]
    	 0.419908			0.295251			0.369588
    Вывод: нет ультраметричности.
    
    
    d(RS2_BACAN, RS2_CLOTE) + d(RS2_ENTFA, RS2_FINM2) = 0.352891 + 0.551788 = 0.904679
    d(RS2_BACAN, RS2_ENTFA) + d(RS2_CLOTE, RS2_FINM2) = 0.295251 + 0.390700 = 0.685951
    d(RS2_BACAN, RS2_FINM2) + d(RS2_CLOTE, RS2_ENTFA) = 0.397747 + 0.422336 = 0.820083
    В принципе, похоже на выполнение свойства аддитивности. Первая и последняя сумма приблизительно равны с точностью 0.8 (по сравнению со второй - вообще не равны)
     и больше второй.
    

    7. fneighbor

    Neighbor-Joining алгоритм
    UPGMA алгоритм
    Дерево, построенное по первому алгоритму, совпадает с реальным, если его укоренить на третьем узле слева.
    В дереве второго алгоритма клады ((ENTFA, LACLM), LACDA) и ((BACAN, LISMO), STAES) совпадают с правильными, но положение CLOTE не верно.
    Из ошибочности второго дерева можно заключить, что для данных белков гипотеза молекулярных часов не работает.

    8. TreeTop

    TreeTop