Учебный сайт Шиндяпиной А.В.

Филогенетические деревья.


Выбрала следующие бактерии:

НазваниеМнемоника
Bradyrhizobium japonicumBRAJA
Rhodobacter sphaeroidesRHOS4
Burkholderia cenocepaciaBURCA
Enterobacter sp. 638 ENT38
Erwinia carotovoraERWCT
Vibrio fischeriVIBFM
Haemophilus influenzaeHAEIN

Скобочная формула

((RHOS4,BRAJA),(BURCA,(VIBFM,(HAEIN,(ERWCT,ENT38)))))

Изображение дерева.

Ветви дерева.

Дерево содержит следующие нетривиальные ветви:
1) {RHOS4,BRAJA} против {BURCA,VIBFM,HAEIN,ERWCT,ENT38}
2) {BURCA,BRAJA,RHOS4} против {VIBFM,HAEIN,ERWCT,ENT38}
3) {BURCA,BRAJA,RHOS4,VIBFM} против {HAEIN,ERWCT,ENT38}
4) {BURCA,BRAJA,RHOS4,VIBFM,HAEIN} против {ERWCT,ENT38}

Реконструкция и сравнение деревьев. Расстояния между последовательностями.

1.Таксоны.

Для поиска таксонов воспользовалась таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/.
НазваниеТаксоны
Bradyrhizobium japonicumcellular organisms; Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Bradyrhizobiaceae; Bradyrhizobium
Rhodobacter sphaeroidescellular organisms; Bacteria; Proteobacteria; Alphaproteobacteria; Rhodobacterales; Rhodobacteraceae; Rhodobacter
Burkholderia cenocepaciacellular organisms; Bacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Burkholderia; Burkholderia cepacia complex
Enterobacter sp. 638 cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Enterobacter;
Erwinia carotovoracellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Pectobacterium
Vibrio fischericellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Aliivibrio
Haemophilus influenzaecellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Pasteurellales; Pasteurellaceae; Haemophilus

Из этих данных видно, что ветвь {RHOS4,BRAJA} против {RHOS4,VIBFM,HAEIN,ERWCT,ENT38} отделяет класс Альфапротеобактерии.
ветвь {BURCA,BRAJA,RHOS4} против {VIBFM,HAEIN,ERWCT,ENT38} отделяет класс Альфапротеобактерии и Бетапротеобактерии от класса Гаммопротеобактерии;
ветвь {BURCA,BRAJA,RHOS4,VIBFM,HAEIN} против {ERWCT,ENT38} отделяет семейство Enterobacteriaceae, представленное здесь двумя видами бактерий.

2.Работа с SwissProt.

В файл efst.fasta с помощью команды seqret положила последовательности белков фактора элонгации транскрипции Ts из выше выбранных мною бактерий.

3. Выравнивания.

С помощью программы muscl и программы GeneDoc получила следующую картинку:

5. Работа с программой fprotpars.

Программа использует метод "максимальной бережливости", поэтому выдает неукороенненые деревьябез длин ветвей. На вход дала файл выравниванием, на выход получила 2 файла: один с деревьями (для данного выравнивания программа построила 2 дерева), второй со скобочными формулами:
1.
                 +--RHOS4     
     +-----------6  
     !           +--BRAJA     
     !  
  +--5           +--ERWCT     
  !  !        +--4  
  !  !     +--3  +--ENT38     
  !  !     !  !  
  1  +-----2  +-----HAEIN     
  !        !  
  !        +--------VIBFM     
  !  
  +-----------------BURCA     
 
(((RHOS4,BRAJA),(((ERWCT,ENT38),HAEIN),VIBFM)),BURCA)

2.
                 +--RHOS4     
     +-----------6  
     !           +--BRAJA     
     !  
  +--5           +--ERWCT     
  !  !     +-----4  
  !  !     !     +--ENT38     
  !  +-----3  
  1        !     +--HAEIN     
  !        +-----2  
  !              +--VIBFM     
  !  
  +-----------------BURCA     

(((RHOS4,BRAJA),((ERWCT,ENT38),(HAEIN,VIBFM))),BURCA)

Первый вариант довольно похож на правильный, за исключением того, что появилась новая ветвь

6.Работа с программой fprotdist.

Программа, как и предыдущая, на вход принимает выравнивание ак-последовательностей. На выходе - файл с матрицей расстояний:
            BURCA     VIBFM     HAEIN     ENT38     ERWCT     BRAJA      RHOS4
BURCA       0.000000  0.925548  0.865692  0.877193  0.881413  1.069233   0.950061

VIBFM       0.925548  0.000000  0.396673  0.400927  0.386116  0.951652   0.913833 

HAEIN       0.865692  0.396673  0.000000  0.360981  0.364279  0.895167   0.810228

ENT38       0.877193  0.400927  0.360981  0.000000  0.070326  0.892947   0.867809

ERWCT       0.881413  0.386116  0.364279  0.070326  0.000000  0.952027   0.948042

BRAJA       1.069233  0.951652  0.895167  0.892947  0.952027  0.000000   0.654274

RHOS4       0.950061  0.913833  0.810228  0.867809  0.948042  0.654274   0.000000

Ультраметричность.
Два самых удачных примера:
1)d(ERWCT,HAEIN)=d(ENT38,HAEIN), d(HAEIN,ERWCT)>d(ERWCT,ENT38), отклонение - 0,003;
2)d(RHOS4,ERWCT)=d(BRAJA,ERWCT), d(RHOS4,ERWCT)>d(RHOS4,BRAJA), отклонение - 0,004.
Аддитивность.
рассмотрим для белков RHOS4,BRAJA,ERWCT,ENT38.
1)d(ERWCT,ENT38)+d(RHOS4,BRAJA)=0.070326+0.654274=0.724600
2)d(BRAJA,ERWCT)+d(RHOS4,ENT38)=0.952027+0.867809=1.819836
3)d(RHOS4,ERWCT)+d(ENT38,BRAJA)=0.948042+0.892947=1.840989
по правилу аддитивности должно быть 3)=2), 3)>1), 2)>1), учитывая что до десятых 3)=2), правило выполняется с отклонением 0.02.

7. Работа с программой fneighbor.

Дерево, полученное по алгоритму Neighbor-Joining:

             +--------------------BRAJA     
  +----------1 
  !          +-----------------RHOS4     
  ! 
  !          +---------HAEIN     
  2----------4 
  !          ! +-----------VIBFM     
  !          +-5 
  !            !       +-ENT38     
  !            +-------3 
  !                    +--ERWCT     
  ! 
  +-----------------------------BURCA     

Дерево, полученное по алгоритму UPGMA:

    +--------------------------BURCA     
  +-5 
  ! !              +-----------VIBFM     
  ! +--------------3 
  !                ! +----------HAEIN     
  !                +-2 
--6                  !        +-ENT38     
  !                  +--------1 
  !                           +-ERWCT     
  ! 
  !       +-------------------BRAJA     
  +-------4 
          +-------------------RHOS4  

В первом случае дерево такое же, как и полученное программой fprotpars, только с учетом длин ветвей.
Алгоритм UPGMA в данном случае ближе к истине :).



©, "ООО Шиндяпина 2008"