Зная, родство этих и других бактерий, из нижнего рисунка можно записать скобочную формулу дерева, а затем построить филогенестическое дерево по этим бактериям.
Дерево содержит 5 нетривиальных ветвей:
1){CLOTE,CLOB1}vs{LACAC,CLOB1,STRPN,BACAN,GEOKA,STAA1}
2){STRPN,LACLM}vs{CLOTE,CLOB1,LACAC,BACAN,GEOKA,STAA1}
3){STRPN,LACLM,LACAC}vs{CLOTE,CLOB1,BACAN,GEOKA,STAA1}
4){BACAN,GEOKA}vs{CLOTE,CLOB1,STRPN,STAA1,LACAC,LACLM}
5){BACAN,GEOKA,STAA1}vs{CLOTE,CLOB1,STRPN,LACAC,LACLM}
___________________________
Занятие 2
Таксономию бактерий можно посмотреть тут . Ветви, которые выделяют таксоны изображены на дереве ниже.
Из выданого списка функций белка был выбран RPOZ (Омега-субъединица ДНК-зависимой РНК-полимеразы).
Из Swiss-Prot были скачаны белки с данной функцией и выбранных организмов. Эти последовательности потом выравнивали.
Потом нашел дивгностические позиции в этих выравниваниях.
Желтый-Clostridia
Красный-Bacilli
Зеленый-Lactobacillales
Синий-Bacillales
Потом провел реконстструкцию с помощью fprotpars.
Скобочная формула дерева
((((BACAN,GEOKA),(((LACLM,STRPN),LACAC),STAA1)),CLOB1),CLOTE); Неукорененное дерево Ветви, которые есть только в одном дереве
Матрица расстояний постореная с помощью fprotdist
Условие выполнения ультраметричности |X+Y|<=MAX(|X|,|Y|) или a=b, c<=a, c<=b
Поверим на CLOB1,CLOTE,STAA1: I)(CLOTE,CLOB1)=0.492278
II)(CLOTE,STAA1)=1.440488
III)(CLOB1,STAA1)=1.574872
II) и III) почти равны.1.574872-1.440488=0,134384.Отклонение=0,134384/0.492278=0.273
Aддитивность: если есть четыре последовательности A,B,C,D, то из трёх сумм 1) d(A,B) + d(C,D) 2) d(A,C) + d(B,D) 3) d(A,D) + d(B,C)
две равны между собой и больше третьей.
Проверим на CLOB1,CLOTE,STAA1,GEOKA: I)(CLOTE,CLOB1)+(STAA1,GEOKA)=1.65268
II)(CLOTE,STAA1)+(CLOB1,GEOKA)=2.691684
III)(CLOB1,STAA1)+(CLOTE,GEOKA)=2.924864
II) и III) почти равны.2.924864-2.691684=0,23318.Отклонение=0,23318/1,65268=0,141 Рекоснтрукция дерева с помощью программы fneighbor. 1)Алгоритм Neighbor-Joining (без молекулярных часов)
(CLOB1:0.25816,((STAA1:0.74789,(GEOKA:0.30764,BACAN:0.38596):0.12315):0.09358,
(LACAC:0.44503,(STRPN:0.33121,LACLM:0.35498):0.13536):0.15032):0.45897,CLOTE:0.23412);
2)Алгоритм UPGMA (с молекулярными часами)
(((CLOTE:0.24614,CLOB1:0.24614):0.41216,((GEOKA:0.34680,
BACAN:0.34680):0.22417,(LACAC:0.46174,(STRPN:0.34309,LACLM:0.34309):0.11865):0.10923):0.08733):0.05223,
STAA1:0.71053);