Занятие 4.

  1. Построение дерева по нуклеотидным последовательностям
  2. Построим филогенетическое дерево тех же бактерий, что в предыдущих заданиях, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).

    Этапы работы

    1. Добыла последовательности 16S рибосомальной РНК каждой из бактерий. последовательности

    2. Выровняла их программой muscle.
      muscle -in bacteria.fasta -out bacteria_aligned.fasta 
      выравнивания
    3. Выравнивание было отправлено на вход программам fdnaml, fdnapars ,fdnadist. Первые две выдали дерево, fdnadist - матрицу расстояний, которую подадим на вход программы fneighbor.
      UPGMA:
          fneighbor -datafile bacteria_tree.fdnadist -outfile bacteria.UPGMA.fneighbor 
          -outtreefile bacteria.UPGMA.fneighbor.tree -treetype u
      

    Рассмотрим дерево, полученное fneighbor с использованием UPGMA
    UPGMA method
    
     Negative branch lengths allowed
    
    
      +----------------------RALPJ     
      ! 
    --7                  +---BURCA     
      !               +--4 
      !               !  +---NEIMA     
      +---------------6 
                      ! +----PSEAE     
                      ! ! 
                      +-5     +ECOLI     
                        !   +-2 
                        !   ! +SALTY     
                        +---3 
                            ! +ENT38     
                            +-1 
                              +ERWCT     

    Дерево не совпадает с правильным. Возможно,потому что реконструкция деревьев по нуклеиновым кислотам дает обычно менее правильный результат, чем по белкам, т.к. одну аминокислоту могут кодировать разные триплеты, .

  3. Построение и анализ дерева, содержащего паралоги
  4. Найдем в своих бактериях достоверные гомологи белка FTSH_ECOLI и построим дерево. Проведем поиск программой BLASTP (с порогом E-value, равным 0.0001) в файле proteo.fasta и отберем те находки, которые относятся к выбранным бактериям.Получим последовательность белка FTSH_ECOLI в fasta-формате с помощью команды:
    seqret sw:FTSH_ECOLI 
    
    Cоздадим индексные файлы пакета BLAST:
    formatdb -i proteo.fasta -p T -n index
    
    Поищем гомологи программой BLASTP c порогом E-value, равным 0.0001:
    blastall -p blastp -d index -i ftsh_ecoli.fasta -o gomologi.txt -e 0.0001
    
    Получили файл gomologi

    Выберем из них те, которые принадлежат выбранным бактериям gom

    Получим их последовательности: sew_bact.fasta

    Выровняем их программой muscle.

    muscle -in sew_bact.fasta -out bact_aligned.fasta 

    bact_aligned.fasta Подадим программе fprotpars.Получили 4 дерева bact_tree.fprotpars, рассмотрим первое:
       +-----------------------------------------------Q9I5R4_PSE
         !  
         !                                            +--B2UIS9_RAL
         !                                         +-17  
         !                 +----------------------16  +--B2UE66_RAL
         !                 !                       !  
         !                 !                       +-----Q1BNJ2_BUR
         !                 !  
         !                 !                          +--B2UGP9_RAL
      +--6  +-------------15                       +-14  
      !  !  !              !        +-------------13  +--Q1BXC9_BUR
      !  !  !              !        !              !  
      !  !  !              !        !              +-----A1IR46_NEI
      !  !  !              !        !  
      !  !  !              +-------12           +--------A4WEY9_ENT
      !  !  !                       !        +--9  
      !  !  !                       !        !  !  +-----FTSH_SALTY
      !  !  !                       !        !  +-11  
      !  +--7                       +--------8     !  +--FTSH_ECOLI
      !     !                                !     +-10  
      !     !                                !        +--Q6D9B8_ERW
      1     !                                !  
      !     !                                +-----------Q9HV48_PSE
      !     !  
      !     !                                +-----------HSLU_PSEAE
      !     !                                !  
      !     !                                !        +--HSLU_SALTY
      !     +--------------------------------2     +--5  
      !                                      !  +--4  +--HSLU_ECOLI
      !                                      !  !  !  
      !                                      +--3  +-----HSLU_ENT38
      !                                         !  
      !                                         +--------HSLU_RALPJ
      !  
      +--------------------------------------------------B2U6W7_RAL
    
    Ортологи (из разных организмов; разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования):

    HSLU_SALTY и HSLU_ECOLI

    FTSH_ECOLI и Q6D9B8_ERW

    B2UGP9_RAL и Q1BXC9_BUR

    Паралоги (два гомологичных белка из одного организма):

    B2UIS9_RAL и B2UE66_RAL