Реконструкция деревьев по нуклеотидным последовательностям.
Анализ деревьев, содержащих паралоги.
  1. Построение дерева по нуклеотидным последовательностям

Получение последовательностей 16S RNA.



Мнемоника         EMBL acsession     Координаты
BACSU             AL009126           9810..11364
CLOB1             CP000726           9282..10783
GEOKA             BA000043           10421..11973
LACAC             CP000033           59255..60826
LISMO             CP001602           263875..265429
STAA1             AP009324           531922..533476
STRPN             CP000918           16782..18239


Дерево,полученное программой fdnapars по алгоритму максимальной парсимонии.



           +-bacsu     
        +--5  
        |  |  +--staa1     
     @--3  +--4  
     |  |     +--lismo     
  +--2  |  
  |  |  +---geoka     
  |  |  
  |  +-------strpn     
  |  
  1-----lacac     
  |  
  +------clob1     


Скобочная формула:

((((bacsu:0.02533,(staa1:0.04673,lismo:0.04964):0.01982):0.02704, geoka:0.05800):0.03739,strpn:0.12427):0.03581,lacac:0.09246,clob1:0.12452);

Полученное дерево имеет с правильным 1 общюю ветвь:

{strpn, lacac, clob1} против {bacsu, geoka, lismo, staa1}

(На схеме показана значком "@")

Полученный результат совпадает по точности с реконструкцией по белковому фактору элонгации программой protpars (два лучших дерева имели 0 и 1 совпадающих ветвей).

Дерево,полученное программой ffitch по алгоритму Фитча-Марголиаша.


          +-bacsu     
        @-1 
      +-5 +---geoka     
      ! ! 
    @-4 +--staa1     
    ! ! 
  +-3 +--lismo     
  ! ! 
  ! +-----strpn     
  ! 
  2-----lacac     
  ! 
  +------clob1  


Скобочная формула:

(((((bacsu:0.03145,geoka:0.06417):0.00613,staa1:0.04964):0.00823, lismo:0.04413):0.01275,strpn:0.09150):0.00458,lacac:0.09261,clob1:0.11294);

Полученное дерево имеет с правильным 2 общие ветви:

{strpn, lacac, clob1} против {bacsu, geoka, lismo, staa1}

{strpn, lacac, clob1, lismo, staa1} против {bacsu, geoka}

(На схеме показаны значком "@")

Полученный результат совпадает по точности с реконструкцией по белковому фактору элонгации программой fneighbor по алгоритму UPGMA (лучшee деревo имелo 2 совпадающих ветви).

Исходное дерево:



  1. Построение и анализ дерева, содержащего паралоги

Для нахождения гомологов белка CLPX_BACSU была использована программа blastp на сервере kodomo и файл с белками бактерий proteo.fasta

Было найдено 25 белков с e-value < 0.1, 21 из них включены в итоговое дерево.

Дерево построено программой fneighbor по алгоритму UPGMA.




                                                +------CLPX_STRPN
                                     +----------9 
                                     !          ! +------CLPX_CLOB1
                                     !          +-7 
                                     !            ! +-----CLPX_STAA1
                                     !            +-6 
                                     !              !  +---CLPX_LISMO
              +---------------------17              +--2 
              !                      !                 ! +-CLPX_BACSU
              !                      !                 +-1 
              !                      !                   +-CLPX_GEOKA
              !                      !  
              !                      !       +---------HSLU_LACAC
              !                      +------13  
              !                              !  +-------HSLU_STAA1
              !                              +-11  
              !                                 ! +------HSLU_LISMO
           +-18                                 +-8 
           !  !                                   !  +---CLPY_BACSU
           !  !                                   +--3 
           !  !                                      +---HSLU_GEOKA
           !  !  
           !  !                                  +-------RUVB_STRPN
           !  !                               +-10  
           !  !                               !  ! +-----RUVB_LISMO
  +-------19  !                               !  +-5 
  !        !  +------------------------------12    ! +----RUVB_BACSU
  !        !                                  !    +-4 
  !        !                                  !      +----RUVB_GEOKA
  !        !                                  !  
  !        !                                  +--------RUVB_CLOB1
  !        !  
-20        !                           +---------------CLPB_LISMO
  !        +--------------------------16  
  !                                    !     +---------CLPE_BACSU
  !                                    +----14  
  !                                          +---------CLPE_STRPN
  !  
  !                                      +------------FTSH_BACSU
  +-------------------------------------15  
                                         +------------FTSH_STRPN




Белки CLPX, HSLU, RUBV, CLPE, FTSH из разных организмов являются ортологами. Наример: FTSH_BACSU и FTSH_STRPN, CLPX_BACSU и CLPX_STAA1, RUVB_LISMO и RUVB_GEOKA.

Представленные на дереве белки из одного организма являются паралогами. Например: CLPX_BACSU и CLPY_BACSU, RUVB_STRPN и CLPE_STRPN, CLPX_GEOKA и RUVB_GEOKA.




© Eugenia Zotova