Филогенетические деревья.

НазваниеМнемотика
Bacillus anthracisBACAN
Bacillus subtilisBACSU
Clostridium botulinumCLOB1
Clostridium tetaniCLOTE
Enterococcus faecalisENTFA
Finegoldia magnaFINM2
Geobacillus kaustophilusGEOKA
Lactobacillus acidophilusLACAC


((FINM2,(CLOTE,CLOB1)),((LACAC,ENTFA),(GEOKA,(BACAN,BACSU))));



Нетривиальные ветви:
{CLOTE,CLOB1} против {FINM2,LACAC,ENTFA,GEOKA,BACAN,BACSU}
{LACAC,ENTFA} против {FINM2,CLOTE,CLOB1,GEOKA,BACAN,BACSU}
{BACAN,BACSU} против {FINM2,LACAC,ENTFA,GEOKA,CLOTE,CLOB1}

На этом дереве есть ветви, которые отделяют таксоны:
1)Ветви, отходящие от корня, разделяют классы Clostridia и Bacilli.
2)Верхняя ветвь разделяется на ветви семейств Clostridiales incertae sedis и Clostridiaceae.
3)Нижняя ветвь делится на порядки Bacillales и Lactobacillales.
4)Нижняя ветвь нижней основной ветви делится на рода Bacillus и Geobacillus.


Для дальнейшей работы я решила выбрать фактор элонгации трансляции Ts - EFTS.

Дерево, построенное программой fprotpars
Матрица расстояний; программа fprotdist
Дерево, построенное программой fneighbor по алгоритму Neighbor-Joining
Дерево, построенное программой fneighbor по алгоритму UPGMA

Дерево, построенное fprotpars отличается от правильного тем, что на нем LACAC вынесена отдельно от всех остальных бактерий. Но это легко объясняется выравниванием в GeneDoc - у этой бактерии у единственной есть последовательность из примерно 50 аминокислот, тогда как у остальных от нее остальнось только 9-10 аминокислот.
Аддитивность я проверяла, приняв за A, B, C и D LACAC, ENTFA, GEOKA и BACSU.
d(A,B)+d(C,D)=1,042009
d(A,C)+d(B,D)=1,298294
d(A,D)+d(B,C)=1,307928
А по правилу какие-то две цифры должны быть равны между собой и привышать третью.


Два примера отклонения от ультраметричности:
d(LACAC,ENTFA)>d(ENTFA,GEOKA) = 0,698978>0,511004
d(LACAC,ENTFA)=d(LACAC,GEOKA) (?) нет, так как 0,765444 не равно 0,698978

d(BACAN,CLOB1)>d(CLOB1,CLOTE) = 0,822328>0,369079
d(BACAN,CLOB1)=d(BACAN,CLOTE) (?) нет, так как 0,822328 не равно 0,794347
©