Назад

Построение филогенетического дерева бактерий

Отобранные организмы

Выбраны из заданного списка бактерий 8 представителей, приведенных в таблице ниже:

НазваниеМнемоника
Agrobacterium tumifaciensAGRRK
Rhodobacter sphaeroidesRHOS4
Neisseria meningitidisNEIMA
Pseudomonas aeruginosaPSEAE
Erwinia carotovoraERWCT
Escherichia coliECOLI
Salmonella typhimuriumSALTY
Ralstonia pickettiiRALPJ

Руководствуясь приведённым филогенетическим деревом:



построим филогенетическое дерево выбранных организмов:


рис.1

Скобочная формула дерева

(((((SALTY, ECOLI), ERWCT), PSEAE), (NEIMA, RALPJ)), (RHOS4, AGRRK))

Ветви дерева

Дерево содержит 5 нетривиальных ветвей:
1){SALTY, ECOLI} против {AGRRK, RHOS4, NEIMA, PSEAE, ERWCT, RALPJ}
2){SALTY, ECOLI, ERWCT} против {AGRRK, RHOS4, NEIMA, PSEAE, RALPJ}
3){SALTY, ECOLI, ERWCT, PSEAE} против {AGRRK, RHOS4, NEIMA, RALPJ}
4){SALTY, ECOLI, ERWCT, PSEAE, NEIMA, RALPJ} против {AGRRK, RHOS4}
5){SALTY, ECOLI, ERWCT, PSEAE, AGRRK, RHOS4} против {NEIMA, RALPJ}

Таксономия

Пользуясь таксономическим сервисом NCBI: http://www.ncbi.nlm.nih.gov/taxonomy/, определили, к каким таксонам относятся отобранные бактерии.


Подпишем ветви, выделяющие таксоны, на рисунке 1.


Для реконструирования филогенетического дерева выбрана функция "Омега-субъединица ДНК-зависимой РНК-полимеразы", мнемоника которой RPOZ.
Получили последовательности белков из Swiss-Prot с данной функцией из отобранных раннее бактерий в файл proteins.fasta.
С помощью программы muscle построили множественное выравнивание последовательностей этих белков в файле.
Обсуждение результатов этого выравнивания здесь.

Программа fprotpars

Программой fprotpars провели реконструкцию дерева, изображенного на рис.1
На вход программе подается файл с выравненными последовательностями белков.
В результате получено одно дерево(proteins_aligned.fprotpars ).


Есть несколько отличий между двумя полученными разными способами филогенетическими деревьями:

  • 1)в реконструированном дереве отсутствует ветвь {SALTY, ECOLI, ERWCT, PSEAE} против {AGRRK, RHOS4, NEIMA, RALPJ};
  • 2)появилась ветвь {AGRRK, RHOS4, SALTY, ECOLI, ERWCT} против {NEIMA, RALPJ, PSEAE}

    Скобочная формула

    (((((NEIMA, RALPJ), PSEAE), ((SALTY, ECOLI), ERWCT))), RHOS4), AGRRK)

    Программа fprotdist

    С помощью данной программмы можно оценить эволюционные расстояния между последовательностями.
    Результат запуска fprotdist для полученных ранее последовательностей:

    		Computing distances:
      		RPOZ_AGRRK
      		RPOZ_RHOS4   .
      		RPOZ_ERWCT   ..
      		RPOZ_ECOLI   ...
      		RPOZ_SALTY   ....
      		RPOZ_PSEAE   .....
      		RPOZ_NEIMA   ......
      		RPOZ_RALPJ   .......
    		
    		Матрица расстояний 
                  8
                 RPOZ_AGRRK  0.000000  0.514907  1.148540  1.153820  1.153820  0.948483  0.993756  0.847439
                 RPOZ_RHOS4  0.514907  0.000000  1.129533  1.117747  1.117747  1.040080  0.829497  0.857569
                 RPOZ_ERWCT  1.148540  1.129533  0.000000  0.065701  0.065701  0.968992  0.751120  0.964070
                 RPOZ_ECOLI  1.153820  1.117747  0.065701  0.000000  0.000010  1.007247  0.779722  0.972634
                 RPOZ_SALTY  1.153820  1.117747  0.065701  0.000010  0.000000  1.007247  0.779722  0.972634
                 RPOZ_PSEAE  0.948483  1.040080  0.968992  1.007247  1.007247  0.000000  0.957697  0.748470
                 RPOZ_NEIMA  0.993756  0.829497  0.751120  0.779722  0.779722  0.957697  0.000000  0.547241
                 RPOZ_RALPJ  0.847439  0.857569  0.964070  0.972634  0.972634  0.748470  0.547241  0.000000
    
    

    Отклонение от ультраметричности

    Условие ультраметричности: d(A,B) > d (B,C), то d (A,C) = d (A,B);
    Рассмотрим 3 примера:
    1)d(RPOZ_AGRRK, RPOZ_RHOS4) = 0.514907
    d(RPOZ_AGRRK, RPOZ_ERWCT) = 1.148540
    d(RPOZ_RHOS4, RPOZ_ERWCT) = 1.129533
    Отклонение в данном случае: 1.148540-1.129533=0.019007
    2)d(RPOZ_ECOLI, RPOZ_SALTY) = 0.000010
    d(RPOZ_ECOLI, RPOZ_PSEAE) = 1.007247
    d(RPOZ_SALTY, RPOZ_PSEAE) = 1.007247
    Отклонение равно 0, таким образом расстояние ультраметрично.
    3)d(RPOZ_PSEAE, RPOZ_NEIMA) = 0.957697
    d(RPOZ_PSEAE, RPOZ_RALPJ) = 0.748470
    d(RPOZ_NEIMA, RPOZ_RALPJ) = 0.547241
    Отклонение равно 0.209227
    Как можно видеть, чем филогенетически ближе последовательности, тем меньше отклонение от ультраметричности, в случае 2 - отклонения нет.

    Отклонение от аддитивности

    d(RPOZ_ECOLI, RPOZ_SALTY)   = 0.000010    (1)
    d(RPOZ_ECOLI, RPOZ_PSEAE) = 1.007247 (2)
    d(RPOZ_SALTY, RPOZ_PSEAE) = 1.007247 (3)
    d(RPOZ_ECOLI, RPOZ_ERWCT) = 0.065701 (4)
    d(RPOZ_ERWCT, RPOZ_SALTY) = 0.065701 (5)
    d(RPOZ_ERWCT, RPOZ_PSEAE) = 0.968992 (6)
    (1)+(6)=0.969092
    (3)+(4)=(2)+(5)=1.072948

    Таким образом, выполнено условие аддитивности: если есть 4 последовательности, то из трех сумм, в каждой из которых присутствуют все последовательности, две равны между собой и больше третьей.

    Программа fneighbor

    Получили две реконструкции дерева данной программой, используя два алгоритма: UPGMA и Neighbor-Joining.
    Алгоритм Neighbor-Joining в файле proteins_aligned.fneighbor

    Алгоритм UPGMA в файле proteins_aligned2.fneighbor

    Сравнение полученных деревьев

    fneighbor: алгоритмы Neighbor-Joining и UPGMA
    Алгоритм Neighbor-Joining выдает неукорененное дерево и не предполагает гипотезы "Молекулярных часов".
    Топология дерева отличается от правильного:
    в Neighbor-Joining есть ветви
    {SALTY, ECOLI, ERWCT, NEIMA} против {AGRRK, RHOS4, PSEAE, RALPJ}
    {SALTY, ECOLI, ERWCT, NEIMA, RALPJ} против {AGRRK, RHOS4, PSEAE}
    нет ветвей по сравнению с UPGMA(укорененное)
    {SALTY, ECOLI, ERWCT, AGRRK, RHOS4} против {NEIMA, RALPJ, PSEAE}
    {SALTY, ECOLI, ERWCT, PSEAE, AGRRK, RHOS4} против {NEIMA, RALPJ}

    Скобочные формулы

    ((((((SALTY, ECOLI), ERWCT), NEIMA), RALPJ), PSEAE), (AGRRK, RHOS4)) - Neighbor-Joining
    ((((SALTY, ECOLI), ERWCT), (PSEAE, (NEIMA, RALPJ))), (AGRRK, RHOS4)) - UPGMA

    fneighbor и fprotpars

    Общее для деревьев, полученных программами fneighbor и fprotpars - клада {SALTY, ECOLI, ERWCT}

    Сравнивая все деревья с правильным на рис. 1, получаем, что топология каждого из деревьев различна, но можно заметить, что клада {SALTY, ECOLI, ERWCT} является общей для всех полученных деревьев.
    Таким образом, можно утверждать, что самыми последними отделились Enterobacteriales, а Alphaproteobacteria - первыми из представленных организмов.



    © Ксения Лежнина 2008