назад

Построение дерева по нуклеотидным последовательностям:

Постороим филогенетическое дерево бактерий на основании последовательности РНК малой субъеденицы рибосомы (16S rRNA).

Для этого сделаем выравниавние программой muscle последовательностей 16S rRNA этих бактерий.

На основании выравнивания, с помощью программы fdnaml (метод наибольшего правдоподобия) получено дерево: ( выходной файл , файл с формулой дерева)

        +SALTY     
     +--6  
  +--5  +-ECOLI     
  |  |  
  |  +--VIBFM     
  |  
  |  +---PSEAE     
  3--4  
  |  |      +--RHOS4     
  |  +------1  
  |         |  +-RHIEC     
  |         +--2  
  |            +----BRAJA     
  |  
  +----------------------------------------RALPJ     

        

Это дерево не совпадает с правильным . В полученном дереве есть ветвь {PSEAE, RHOS4, RHIEC, BRAJA} против {RALPJ, SALTY, ECOLI, VIBFM}; нет ветви {BRAJA, RHIEC, RHOS4, RALPJ} против {PSEAE, ECOLI, SALTY, VIBFM}.

По сравнению с деревом , построенным по белкам (см Филогенетическое дерево ), у полученного дерева отсутсвует ветвь {PSEA, RALPJ} против {SALTY, ECOLI, VIBFM, RHOS4, RHIEC, BRAJA}. Но на всех деревьях есть поддеревья ((SALTY, ECOLI), VIBFM) и ((RHIEC, BRAJA), RHOS4).

Дерево , построенное с помощью матрицы расстояний fdnadist и далее программы fneighbor (алгоритм Neighbor-Joining) , совпадает с деревом fdnaml .

А дерево , построенное программой fdnapars (методом максимальной бережливости) , отличается от правильного еще больше.

Построение и анализ дерева, содержащего паралоги:

Найдем в бактериях достоверные гомологи белка FTSH_ECOLI . Для этого сделаем индексные файлы для пакета BLAST по файлу proteo.fasta , содержащиму последовательности белков протеобактерий (в том числе и наших бактерий): formatdb -i proteo.fasta -p T -n prot
Заетм воспользуемся программой BLASTP: blastall -p blastp -d prot -i ftsh_ecoli.fasta -e 0.0001 -o result_blastp.txt
В полученном файле с гомологами (E-value которых <=0.0001), выберем гомологов из наших бактерий - в файле gomologs.list
Теперь последовательность этих гомологов gomologs.fasta подадим на вход программе muscle: muscle -in gomologs.fasta -out gomologs_aln.fasta
Наконец используем полученное выравнивание для построения дерева с помощью программы fprotpars: ( выходной файл , скобочная формула дерева )




                                                                    +--Q89KG3_BRAJA
     +--------------------------------------------------------------9  
     !                                                              +--Q2K9U5_RHIEC
     !  
     !     +-----------------------------------------------------------Q89BR3_BRAJA
     !     !  
     !     !                                      +--------------------B2UGP9_RALPJ
  +--8     !                                      !  
  !  !     !                                      !                 +--FTSH_SALTY
  !  !     !                                      !              +-21  
  !  !     !                                +----17           +-20  +--FTSH_ECOLI
  !  !     !                                !     !           !  !  
  !  !     !                                !     !  +-------19  +-----B5FA73_VIBFM
  !  !     !                                !     !  !        !  
  !  +----10                                !     !  !        +--------Q9HV48_PSEAE
  !        !                                !     +-18  
  !        !  +----------------------------14        !              +--Q9XBG5_BRAJA
  !        !  !                             !        !           +-16  
  !        !  !                             !        +----------15  +--Q2K4M2_RHIEC
  !        !  !                             !                    !  
  !        !  !                             !                    +-----Q3J045_RHOS4
  !        !  !                             !  
  !        !  !                             !                       +--B2UIS9_RALPJ
  !        !  !                             +----------------------13  
  !        +-12                                                     +--B2UE66_RALPJ
  !           !  
  1           !                                                     +--Q8KKT3_RHIEC
  !           !                                                  +-23  
  !           !                             +-------------------22  +--B5FCR8_VIBFM
  !           !                             !                    !  
  !           !                             !                    +-----Q9I5R4_PSEAE
  !           !                             !  
  !           +----------------------------11                       +--HSLU_BRAJA
  !                                         !        +--------------7  
  !                                         !        !              +--HSLU_RHOS4
  !                                         !        !  
  !                                         !        !              +--HSLU_SALTY
  !                                         +--------6           +--5  
  !                                                  !        +--4  +--HSLU_ECOLI
  !                                                  !        !  !  
  !                                                  !     +--3  +-----HSLU_VIBFM
  !                                                  !     !  !  
  !                                                  +-----2  +--------HSLU_PSEAE
  !                                                        !  
  !                                                        +-----------HSLU_RALPJ
  !  
  +--------------------------------------------------------------------B2U6W7_RALPJ
     
       

Заметим, что поддерево, содержащее белки HSLU, совпадает с правильным деревом , но на дереве HSLU нет бактерии RHIEC (вероятно не нашлось гомолога этого семейства среди белков бактерии). Т.е. можно было бы использовать последовательность белка HSLU бактерий для реконструкции филогенетического дерева.

Ортологи (гомологи из разных организмов; разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования): HSLU_SALTY и HSLU_ECOLI; Q89KG3_BRAJA и Q2K9U5_RHIEC; FTSH_SALTY и FTSH_ECOLI...

Паралоги (два гомологичных белка из одного организма): HSLU_SALTY и FTSH_SALTY, Q9HV48_PSEAE и Q9I5R4_PSEAE, B2UIS9_RALPJ и B2UE66_RALPJ....