Филогенестические деревья

Занятие 1

Из списка были отобраны следующие 8 бактерий:
НазваниеМнемоника
Bacillus anthracisBACAN
Staphylococcus aureusSTAA1
Clostridium botulinumCLOB1
Streptococcus pyogenesSTRP1
Clostridium tetaniCLOTE
Lactococcus lactisLACLM
Geobacillus kaustophilusGEOKA
Lactobacillus acidophilusLACAC
Зная, родство этих и других бактерий, из нижнего рисунка можно записать скобочную формулу дерева, а затем построить филогенестическое дерево по этим бактериям.

Общее дерево

Скобочная формула дерева (нового)

((CLOTE,CLOB1),(((STRPN,LACLM),LACAC),((BACAN,GEOKA),STAA1)));

Изображение нового дерева


Ветви дерева

Дерево содержит 5 нетривиальных ветвей:
1){CLOTE,CLOB1}vs{LACAC,CLOB1,STRPN,BACAN,GEOKA,STAA1}
2){STRPN,LACLM}vs{CLOTE,CLOB1,LACAC,BACAN,GEOKA,STAA1}
3){STRPN,LACLM,LACAC}vs{CLOTE,CLOB1,BACAN,GEOKA,STAA1}
4){BACAN,GEOKA}vs{CLOTE,CLOB1,STRPN,STAA1,LACAC,LACLM}
5){BACAN,GEOKA,STAA1}vs{CLOTE,CLOB1,STRPN,LACAC,LACLM}

___________________________

Занятие 2

Таксономию бактерий можно посмотреть тут . Ветви, которые выделяют таксоны изображены на дереве ниже.


Из выданого списка функций белка был выбран RPOZ (Омега-субъединица ДНК-зависимой РНК-полимеразы). Из Swiss-Prot были скачаны белки с данной функцией и выбранных организмов. Эти последовательности потом выравнивали.

Потом нашел дивгностические позиции в этих выравниваниях.

Желтый-Clostridia
Красный-Bacilli

Зеленый-Lactobacillales
Синий-Bacillales

Потом провел реконстструкцию с помощью fprotpars.
Скобочная формула дерева
((((BACAN,GEOKA),(((LACLM,STRPN),LACAC),STAA1)),CLOB1),CLOTE);
Неукорененное дерево

Ветви, которые есть только в одном дереве


Матрица расстояний постореная с помощью fprotdist

Условие выполнения ультраметричности
|X+Y|<=MAX(|X|,|Y|) или a=b, c<=a, c<=b
Поверим на CLOB1,CLOTE,STAA1:
I)(CLOTE,CLOB1)=0.492278
II)(CLOTE,STAA1)=1.440488
III)(CLOB1,STAA1)=1.574872

II) и III) почти равны.1.574872-1.440488=0,134384.Отклонение=0,134384/0.492278=0.273
Aддитивность:
если есть четыре последовательности A,B,C,D, то из трёх сумм 1) d(A,B) + d(C,D) 2) d(A,C) + d(B,D) 3) d(A,D) + d(B,C) две равны между собой и больше третьей.
Проверим на CLOB1,CLOTE,STAA1,GEOKA:
I)(CLOTE,CLOB1)+(STAA1,GEOKA)=1.65268
II)(CLOTE,STAA1)+(CLOB1,GEOKA)=2.691684
III)(CLOB1,STAA1)+(CLOTE,GEOKA)=2.924864

II) и III) почти равны.2.924864-2.691684=0,23318.Отклонение=0,23318/1,65268=0,141
Рекоснтрукция дерева с помощью программы fneighbor.
1)Алгоритм Neighbor-Joining (без молекулярных часов)

(CLOB1:0.25816,((STAA1:0.74789,(GEOKA:0.30764,BACAN:0.38596):0.12315):0.09358, (LACAC:0.44503,(STRPN:0.33121,LACLM:0.35498):0.13536):0.15032):0.45897,CLOTE:0.23412);

2)Алгоритм UPGMA (с молекулярными часами)

(((CLOTE:0.24614,CLOB1:0.24614):0.41216,((GEOKA:0.34680, BACAN:0.34680):0.22417,(LACAC:0.46174,(STRPN:0.34309,LACLM:0.34309):0.11865):0.10923):0.08733):0.05223, STAA1:0.71053);

Вернуться на страничку 4 семестра
© Сливко-Кольчик