Реконструкция деревьев по нуклеотидным последовательностям. Анализ деревьев, содержащих паралоги.

Построение дерева по нуклеотидным последовательностям

Для построения филогенетического дерева была использована последовательность 16S рибосомальной РНК из малой субъединицы рибосомы.
Все последовательности были взяты из EMBL.

Мнемоника бактерии Запись EMBL
BACAN AB506122
BACSU JN252087
CLOTE X74770
ENTFA AB680193
GEOKA JQ311984
LACDA AB680073
LISMO AJ508749
STAES AB680360
STRP1 AB002521

Последовательности были записаны в 1 файл и выровнены программой mascle.

Выравнивание было отправлено на вход программам fdnaml, fdnapars и fdnadist.

Дерево fdnaml:

 +-ENTFA     
     +--6  
     |  |  +-LISMO     
     |  +--7  
     |     |  +--STAES     
     |     +--3  
  +--1        |  +BACAN     
  |  |        +--4  
  |  |           |  +BACSU     
  |  |           +--5  
  |  |              +-----GEOCA     
  |  |  
  |  +----STRP1     
  |  
  2----LACDA     
  |  
  +--------CLOTE 

В данном случае имеются только две общие ветви с правильным деревом:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
(STAES, LISMO, GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1)

Дерево fdnapars:

+--ENTFA     
     |  
  +--6  +--STAES     
  |  |  |  
  |  +--3     +-BACAN     
  |     |  +--4  
  |     |  |  +------STRP1     
  |     +--2  
  |        |             +-LISMO     
  |        +-------------7  
  |                      |        +BACSU     
  |                      +--------5  
  |                               +-----GEOCA     
  |  
  1----LACDA     
  |  
  +----------CLOTE

А вот у этого дерева вообще нет ничего общего с правильным!

Матрица расстояний, полученная от программы fdnadist, обработана программами fneighbor (Neighbor-Joining), ffitch и fkitsch.

Neighbor-Joining:

          +----GEOCA     
        +-1 
      +-2 +-BACSU     
      ! ! 
    +-3 +-BACAN     
    ! ! 
  +-5 +-STAES     
  ! ! 
  ! ! +-ENTFA     
  ! +-4 
  !   +---LISMO     
  ! 
  ! +-----LACDA     
  6-7 
  ! +----STRP1     
  ! 
  +-------CLOTE 

У данного дерева наблюдается одна общая ветвь с правильным:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)

Дерево ffitch:

    +-ENTFA     
    ! 
  +-1 +--LISMO     
  ! ! ! 
  ! ! !     +-BACSU     
  ! +-7   +-5 
  !   ! +-3 +-----GEOCA     
  !   ! ! ! 
  !   +-4 +-BACAN     
  !     ! 
  !     +--STAES     
  ! 
  ! +----STRP1     
  6-2 
  ! +-----LACDA     
  ! 
  +-------CLOTE  

У этого дерева те же общие с правильным, что и у fdnaml:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
(STAES, LISMO, GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1)

Дерево fkitsch:

            +-LISMO     
          +-8 
          ! +-ENTFA     
        +-7 
        ! !   +-BACSU     
        ! ! +-6 
      +-4 +-5 +-BACAN     
      ! !   ! 
      ! !   +-STAES     
    +-2 ! 
    ! ! +---STRP1     
  +-3 ! 
  ! ! +---GEOCA     
--1 ! 
  ! +----LACDA     
  ! 
  +-----CLOTE

Общая ветвь с правильным:
(BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO, GEOKA)

Построение и анализ дерева, содержащего паралоги

Среди белков девяти, отобранных ранее, бактерий были найдены гомологи белка CLPX_BACSU.
Для этого был создан банк по файлу с диска Р, содержащему записи банка UniProt. При помощи blastp по банку был произведен поиск гомологов белка с Evalue < 0.001
Среди находок были отобраны только белки, относящиеся к интересующим нас бактериям. С помощью программы seqret были получены последовательности этих белков. Программой muscle было получено выравнивание.

С помощью программы fprotpars по выравниванию было построено дерево:


                                      +--------------------CLPX_STRP1
                                      !  
                                      !  +-----------------CLPX_ENTFA
     +--------------------------------7  !  
     !                                !  !           +-----CLPX_BACSU
     !                                !  !        +-11  
     !                                +--6        !  !  +--CLPX_BACAN
     !                                   !  +----10  +-12  
     !                                   !  !     !     +--CLPX_GEOKA
     !                                   !  !     !  
     !                                   +--9     +--------CLPX_LISMO
     !                                      !  
     !                                      !           +--CLPX_STAES
     !                                      +-----------8  
     !                                                  +--CLPX_CLOTE
  +--5  
  !  !                                                  +--HSLU_GEOKA
  !  !                                               +-19  
  !  !                                            +-18  +--CLPY_BACSU
  !  !                                            !  !  
  !  !                                         +-17  +-----HSLU_BACAN
  !  !                                         !  !  
  !  !                                   +----16  +--------HSLU_LISMO
  !  !                                   !     !  
  !  !                       +----------15     +-----------HSLU_STAES
  !  !                       !           !  
  1  !                       !           !              +--HSLU_ENTFA
  !  !                       !           +-------------14  
  !  +----------------------13                          +--HSLU_LACDA
  !                          !  
  !                          !                    +--------CLPE_BACSU
  !                          !                    !  
  !                          +--------------------2     +--CLPC_STAES
  !                                               !  +--4  
  !                                               +--3  +--CLPC_BACSU
  !                                                  !  
  !                                                  +-----CLPB_CLOTE
  !  
  +--------------------------------------------------------RUVB_LISMO

Примеры ортологов и паралогов:

Ортологи (из разных организмов; разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования):



Паралоги (два гомологичных белка из одного организма):