Филогенетические деревья

Занятие 1.

Из представленного в задании списка выберем 8 видов:

НазваниеМнемоника
Rhizobium etliRHIEC
Neisseria meningitidisNEIMA
Erwinia carotovoraERWCT
Escherichia coliECOLI
Salmonella typhimuriumSALTY
Yersinia pestis YERPE
Vibrio fischeriVIBFM
Proteus mirabilisPROMH

Скобочная версия:

(RHIEC,(NEIMA,(VIBFM,(PROMH,(YERPE,(ERWCT,(SALTY,ECOLI)))))))

Графическое изображение:

Нетривиальные ветви:

1.{RHIEC,NEIMA} и {VIBFM,PRDMH,YERPE,ERWCT,SALTY,ECOLI}
2.{RHIEC,NEIMA,VIBFM} и {PRDMH,YERPE,ERWCT,SALTY,ECOLI}
3.{RHIEC,NEIMA,VIBFM,PRDMH} и {YERPE,ERWCT,SALTY,ECOLI}
4.{RHIEC,NEIMA,VIBFM,PRDMH,YERPE} и {ERWCT,SALTY,ECOLI}
5.{RHIEC,NEIMA,VIBFM,PRDMH,YERPE,ERWCT} и {SALTY,ECOLI}

Занятие 2.

1. Таксономические категории, построенные по данным с сайта NCBI:

(подчеркнуты совпадения)

1. Rhizobium etli:

cellular organisms; Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Rhizobium
2. Neisseria meningitidis:
cellular organisms; Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria
3. Erwinia carotovora:
cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Pectobacterium
4. Escherichia coli:
cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia
5. Salmonella typhimurium:
cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella;
 Salmonella enterica; Salmonella enterica subsp. enterica
6. Yersinia pestis:
cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia
7. Vibrio fischeri:
cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Aliivibrio
8. Proteus mirabilis:
cellular organisms; Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Proteus

красным наиболее близкие виды.

2.Выбор функции белка и получение его последовательностей в организмах.

Мною была выбрана функция Энолаза (мнемоника - ENO).

используем команду: seqret sw:ENO_XXXXX

Получим набор последовательностей белков из выбранных ранее организмов:

Rhizobium etli
Neisseria meningitidis
Erwinia carotovora
Escherichia coli
Salmonella typhimurium
Yersinia pestis
Vibrio fischeri
Proteus mirabilis

3. Выравнивание последовательностей белков.

Совместные последовательности белков

Используем команду:

muscle -in eno.fasta -out eno_aligned.fasta

для анализа последовательностей программой MUSCLE.

Полученный файл

4. (дополнительное) Поиск диагностических позиций в выравнивании последовательностей белка ENO из разных бактерий в GeneDoc.

5. Реконструкция дерева программой fprotpars.

Для работы с программой пользуемся командой :

fprotpars -sequence eno_aligned.fasta -outfile eno.fprotpars
Получили скобочную формулу данного дерева :
(((NEIMA,RHIEC),(((YERPE,ERWCT),(SALTY,ECOLI)),PROMH)),VIBFM)
Так же получили одно графическое изображение данного дерева:
                    +--NEIMA 
     +--------------7  
     !              +--RHIEC 
     !  
     !              +--YERPE 
  +--6        +-----5  
  !  !        !     +--ERWCT 
  !  !     +--4  
  !  !     !  !     +--SALTY 
  1  +-----2  +-----3  
  !        !        +--ECOLI 
  !        !  
  !        +-----------PROMH 
  !  
  +--------------------VIBFM 

Полученное дерево отличается от правильного (выданного нам). Отличие заключается в расположении бактерии ERWCT,

в полученном дереве этот вид бактерии дает кладу с YERPE.

6. Оценка эволюционного расстояния между последовательностями с помощью программы fprotdist.

Программа была запущена при помощи команды :

fprotdist -sequence eno_aligned.fasta -outfile rass.fprotdist
Была получена матрица расстояний :
          VIBFM     PROMH     ECOLI     SALTY     ERWCT     YERPE    RHIEC     NEIMA
VIBFM   0.000000  0.152839  0.139331  0.142313  0.143594  0.124280 0.525515  0.480328
PROMH   0.152839  0.000000  0.097775  0.095445  0.106934  0.108578 0.526616  0.529689
ECOLI   0.139331  0.097775  0.000000  0.013573  0.056151  0.056078 0.479487  0.491924
SALTY   0.142313  0.095445  0.013573  0.000000  0.053870  0.061042 0.484270  0.499858
ERWCT   0.143594  0.106934  0.056151  0.053870  0.000000  0.039395 0.507924  0.500561
YERPE   0.124280  0.108578  0.056078  0.061042  0.039395  0.000000 0.497556  0.492315
RHIEC   0.525515  0.526616  0.479487  0.484270  0.507924  0.497556 0.000000  0.464549
NEIMA   0.480328  0.529689  0.491924  0.499858  0.500561  0.492315 0.464549  0.000000
 

Утверждение ультраметричности : "Из трех расстояний между тремя объектами два всегда равны между собой и не меньше третьего".

Рассмотрим бактерии SALTY, NEIMA, RHIEC (относятся к разным подгруппам) :

d ( SALTY, NEIMA ) = 0.499858

d ( SALTY, RHIEC ) = 0.484270

d ( NEIMA, RHIEC ) = 0.464549

Условие ультраметричности не выполняется.


Рассмотрим бактерии SALTY, ECOLI, NEIMA (есть близкие виды) :

d ( SALTY, ECOLI ) = 0.013573

d ( SALTY, NEIMA ) = 0.499858

d ( ECOLI, NEIMA ) = 0.491924

Видим, что условие ультраметричности выполняется, если считать d ( SALTY, NEIMA )= d ( ECOLI, NEIMA ) ( разница между ними 0.007934 ).


Утверждение аддитивности : если есть 4 последовательности: A, B, C, D, - то из трех сумм d ( A, B ) + d ( C, D );

d ( A, C ) + d ( B, D ); d ( A, D ) + d ( B, C ) две равны между собой и больше третьей.

Рассмотрим NEIMA, PROMH, ERWCT и ECOLI:

d ( ERWCT, NEIMA ) = 0.500561

d ( ECOLI, NEIMA ) = 0.491924

d ( PROMH, NEIMA ) = 0.529689

d ( PROMH, ERWCT ) = 0.106934

d ( PROMH, ECOLI ) = 0.095445

d ( ERWCT, ECOLI ) = 0.056151


d ( NEIMA, PROMH ) + d ( ERWCT, ECOLI ) = 0.58584

d ( NEIMA, ERWCT ) + d ( PROMH, ECOLI ) = 0.596006

d ( NEIMA, ECOLI ) + d ( PROMH, ERWCT ) = 0.598858

Видим, что две последнии суммы примерно равны между собой (разница 0.002852) и больше первой, что доказывает аддитивность.

7. Реконструкции дерева программой fneighbor с использованием двух алгоритмов: UPGMA и Neighbor-Joining.

Запускаем программы при помощи команд :

Neighbor-Joining:

fneighbor -datafile rass.fprotdist -outfile enoNJ.fneighbor -outtreefile treeNJ.tree 

UPGMA:

fneighbor -datafile rass.fprotdist -outfile enoUPGMA.fneighbor -outtreefile enoUPGMA.tree -treetype u 

Алгоритм UPGMA выдаёт укоренённое дерево с длинами ветвей. Его можно применять, если справедлива гипотеза молекулярных часов

(матрица расстояний не слишком далека от ультраметрической). Алгоритм Neighbor-Joining выдаёт неукоренённое дерево с длинами ветвей;

не предполагает молекулярных часов.

Результаты, полученные в результате с работой с алгоритмом Neighbor-Joining:

Получили скобочную формулу данного дерева :

((RHIEC:0.23450,NEIMA:0.23005):0.19946,(PROMH:0.06344,((ECOLI:0.00616,SALTY:0.00741):0.01834,
(ERWCT:0.02122,YERPE:0.01818):0.01196):0.01036):0.02560,VIBFM:0.07119)

Так же получили одно графическое изображение данного дерева:

              +-------------RHIEC 
  +-----------1 
  !           +-------------NEIMA 
  ! 
  ! +--PROMH 
  ! ! 
  2-5   +ECOLI 
  ! ! +-3 
  ! ! ! +SALTY 
  ! +-6 
  !   ! +ERWCT 
  !   +-4 
  !     +YERPE 
  ! 
  +---VIBFM 

Результаты, полученные в результате с работой с алгоритмом UPGMA :

Получили скобочную формулу данного дерева :

((VIBFM:0.07024,(PROMH:0.05109,((ECOLI:0.00679,SALTY:0.00679):0.02161,(ERWCT:0.01970,YERPE:0.01970):0.00870)
:0.02270):0.01914):0.18043,(RHIEC:0.23227,NEIMA:0.23227):0.01839);

Так же получили одно графическое изображение данного дерева:

             +---VIBFM 
             ! 
  +----------5 +--PROMH 
  !          ! ! 
  !          +-4   +ECOLI 
  !            ! +-1 
  !            ! ! +SALTY 
--7            +-3 
  !              ! +ERWCT 
  !              +-2 
  !                +YERPE 
  ! 
  ! +-------------RHIEC 
  +-6 
    +-------------NEIMA 

Деревья, полученные с помощью алгоритмов UPGMA и Neighbor - Joining, совпадают с деревом, полученным с помощью программы fprotpars,

но все они содержат отличия от истинного дерева. Они обьединяют в одну кладу YERPE и ERWCT.

8. (дополнительное) Сервис TreeTop.

 


©Пискунова Юлия 2010