Учебный сайт Шиндяпиной А.В.
Филогенетические деревья.
Выбрала следующие бактерии:
Название | Мнемоника |
Bradyrhizobium japonicum | BRAJA |
Rhodobacter sphaeroides | RHOS4 |
Burkholderia cenocepacia | BURCA |
Enterobacter sp. 638 | ENT38 |
Erwinia carotovora | ERWCT |
Vibrio fischeri | VIBFM |
Haemophilus influenzae | HAEIN |
Скобочная формула
((RHOS4,BRAJA),(BURCA,(VIBFM,(HAEIN,(ERWCT,ENT38)))))
Изображение дерева.
Ветви дерева.
Дерево содержит следующие нетривиальные ветви:
1) {RHOS4,BRAJA} против {BURCA,VIBFM,HAEIN,ERWCT,ENT38}
2) {BURCA,BRAJA,RHOS4} против {VIBFM,HAEIN,ERWCT,ENT38}
3) {BURCA,BRAJA,RHOS4,VIBFM} против {HAEIN,ERWCT,ENT38}
4) {BURCA,BRAJA,RHOS4,VIBFM,HAEIN} против {ERWCT,ENT38}
Реконструкция и сравнение деревьев. Расстояния между последовательностями.
1.Таксоны.
Для поиска таксонов воспользовалась таксономическим сервисом NCBI:
http://www.ncbi.nlm.nih.gov/taxonomy/.
Название | Таксоны |
Bradyrhizobium japonicum | cellular organisms; Bacteria; Proteobacteria; Alphaproteobacteria;
Rhizobiales; Bradyrhizobiaceae; Bradyrhizobium |
Rhodobacter sphaeroides | cellular organisms; Bacteria; Proteobacteria; Alphaproteobacteria;
Rhodobacterales; Rhodobacteraceae; Rhodobacter |
Burkholderia cenocepacia | cellular organisms; Bacteria; Proteobacteria; Betaproteobacteria;
Burkholderiales; Burkholderiaceae; Burkholderia; Burkholderia cepacia complex |
Enterobacter sp. 638 | cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria;
Enterobacteriales; Enterobacteriaceae; Enterobacter; |
Erwinia carotovora | cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria;
Enterobacteriales; Enterobacteriaceae; Pectobacterium |
Vibrio fischeri | cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria;
Vibrionales; Vibrionaceae; Aliivibrio |
Haemophilus influenzae | cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria;
Pasteurellales; Pasteurellaceae; Haemophilus |
Из этих данных видно, что ветвь {RHOS4,BRAJA} против {RHOS4,VIBFM,HAEIN,ERWCT,ENT38} отделяет класс Альфапротеобактерии.
ветвь {BURCA,BRAJA,RHOS4} против {VIBFM,HAEIN,ERWCT,ENT38} отделяет класс Альфапротеобактерии и Бетапротеобактерии от класса Гаммопротеобактерии;
ветвь {BURCA,BRAJA,RHOS4,VIBFM,HAEIN} против {ERWCT,ENT38} отделяет семейство Enterobacteriaceae, представленное здесь двумя видами бактерий.
2.Работа с SwissProt.
В файл efst.fasta с помощью команды seqret положила последовательности белков фактора элонгации транскрипции Ts из
выше выбранных мною бактерий.
3. Выравнивания.
С помощью программы muscl и программы GeneDoc получила следующую картинку:
5. Работа с программой fprotpars.
Программа использует метод "максимальной бережливости", поэтому выдает неукороенненые деревьябез длин ветвей. На вход дала
файл выравниванием, на выход получила 2 файла: один с деревьями (для данного выравнивания программа построила 2 дерева),
второй со скобочными формулами:
1.
+--RHOS4
+-----------6
! +--BRAJA
!
+--5 +--ERWCT
! ! +--4
! ! +--3 +--ENT38
! ! ! !
1 +-----2 +-----HAEIN
! !
! +--------VIBFM
!
+-----------------BURCA
(((RHOS4,BRAJA),(((ERWCT,ENT38),HAEIN),VIBFM)),BURCA)
2.
+--RHOS4
+-----------6
! +--BRAJA
!
+--5 +--ERWCT
! ! +-----4
! ! ! +--ENT38
! +-----3
1 ! +--HAEIN
! +-----2
! +--VIBFM
!
+-----------------BURCA
(((RHOS4,BRAJA),((ERWCT,ENT38),(HAEIN,VIBFM))),BURCA)
Первый вариант довольно похож на правильный, за исключением того, что появилась новая ветвь
6.Работа с программой fprotdist.
Программа, как и предыдущая, на вход принимает выравнивание ак-последовательностей. На выходе - файл с матрицей расстояний:
BURCA VIBFM HAEIN ENT38 ERWCT BRAJA RHOS4
BURCA 0.000000 0.925548 0.865692 0.877193 0.881413 1.069233 0.950061
VIBFM 0.925548 0.000000 0.396673 0.400927 0.386116 0.951652 0.913833
HAEIN 0.865692 0.396673 0.000000 0.360981 0.364279 0.895167 0.810228
ENT38 0.877193 0.400927 0.360981 0.000000 0.070326 0.892947 0.867809
ERWCT 0.881413 0.386116 0.364279 0.070326 0.000000 0.952027 0.948042
BRAJA 1.069233 0.951652 0.895167 0.892947 0.952027 0.000000 0.654274
RHOS4 0.950061 0.913833 0.810228 0.867809 0.948042 0.654274 0.000000
Ультраметричность.
Два самых удачных примера:
1)d(ERWCT,HAEIN)=d(ENT38,HAEIN), d(HAEIN,ERWCT)>d(ERWCT,ENT38), отклонение - 0,003;
2)d(RHOS4,ERWCT)=d(BRAJA,ERWCT), d(RHOS4,ERWCT)>d(RHOS4,BRAJA), отклонение - 0,004.
Аддитивность.
рассмотрим для белков RHOS4,BRAJA,ERWCT,ENT38.
1)d(ERWCT,ENT38)+d(RHOS4,BRAJA)=0.070326+0.654274=0.724600
2)d(BRAJA,ERWCT)+d(RHOS4,ENT38)=0.952027+0.867809=1.819836
3)d(RHOS4,ERWCT)+d(ENT38,BRAJA)=0.948042+0.892947=1.840989
по правилу аддитивности должно быть 3)=2), 3)>1), 2)>1), учитывая что до десятых 3)=2), правило выполняется с отклонением 0.02.
7. Работа с программой fneighbor.
Дерево, полученное по алгоритму Neighbor-Joining:
+--------------------BRAJA
+----------1
! +-----------------RHOS4
!
! +---------HAEIN
2----------4
! ! +-----------VIBFM
! +-5
! ! +-ENT38
! +-------3
! +--ERWCT
!
+-----------------------------BURCA
Дерево, полученное по алгоритму UPGMA:
+--------------------------BURCA
+-5
! ! +-----------VIBFM
! +--------------3
! ! +----------HAEIN
! +-2
--6 ! +-ENT38
! +--------1
! +-ERWCT
!
! +-------------------BRAJA
+-------4
+-------------------RHOS4
В первом случае дерево такое же, как и полученное программой fprotpars, только с учетом длин ветвей.
Алгоритм UPGMA в данном случае ближе к истине :).
©, "ООО Шиндяпина 2008"