Доделки

Мнемоника AC записи EMBL Координаты FT, в которой описано 16S рРНК На комплиментарной цепи? Программа
CLOTE AE015927 176113..177621 да seqret -sask
BACAN AE017334 9335..10841 нет seqret embl:AE017334[9335:10841] > rna.fasta
STAA1 AP009324 531922..533476 нет seqret embl:AP009324[531922:533476] > rna.fasta
LACDA CP000412 43705..45265 нет seqret embl:CP000412[43705:45265] > rna.fasta
GEOKA BA000043 10421..11973 нет seqret embl:BA000043[10421:11973] > rna.fasta
CLOB1 CP000726 9282..10783 нет seqret embl:CP000726[9282:10783] > rna.fasta
LACLM AM406671 511423..512971 нет seqret embl:AM406671[511423:512971] > rna.fasta
Для бактерии STRPN 16S не нашлось. Для поиска 16s я воспользовался bl2seq. Этой программой был проведен BLASTN генома STRPN и 16s BACAN.16S STRPN тут
Выравниванивание сделал программой muscle.Файл с выравниванием тут
Дерево получил программой fdnapars.

              +--STAA1     
           +--6  
           |  |  +--BACAN     
           |  +--5  
        +--4     +---GEOKA     
        |  |  
        |  |  +---------STRPN1    
  +-----2  +--3  
  |     |     +---LACLM     
  |     |  
  |     +----LACAC     
  |  
  1--CLOTE     
  |  
  +-CLOBE1    


Это дерево очень похоже на правильное.
По ДНК:
(CLOTE;CLOBE)
((BACAN;GEOKA);STAA1)
(BACAN;GEOKA)
(LACLM;STRPN)

По белкам:
(CLOTE;CLOBE)
((LACLM;STRPN);LACAC)
(BACAN;GEOKA)
(LACLM;STRPN)
В принципе обе программы сработали одинаково хорошо. Обе программы не нашли по одной ветви.

Правильное дерево

Fprotpars

Алгоритм Neighbor-Joining (без молекулярных часов)

Алгоритм UPGMA (с молекулярными часами)

Бутстрэп


  • Построение и анализ дерева, содержащего паралоги
  • Было найдено 12 гомологов для данного белка.
    Дерево построено с помощью fprotpars.
    
    
                              +--------HSLU_STAA1
                              !  
         +--------------------9     +--HSLU_GEOKA
         !                    !  +-11  
         !                    +-10  +--HSLU_BACAN
         !                       !  
         !                       +-----HSLU_LACAC
         !  
      +--8                 +-----------CLPX_STAA1
      !  !                 !  
      !  !           +-----5        +--CLPX_BACAN
      !  !           !     !  +-----7  
      !  !           !     !  !     +--CLPX_GEOKA
      !  !           !     +--6  
      !  +-----------3        !     +--CLPX_CLOTE
      1              !        +-----4  
      !              !              +--CLPX_CLOB1
      !              !  
      !              !              +--CLPX_STRPN
      !              +--------------2  
      !                             +--CLPX_LACLM
      !  
      +--------------------------------FTSH_STRPN
    
    Видно, что программа расположила белки с одинаковой функцией на разные ветви.
    Паралоги:
  • HSLU_BACAN и CLPX_BACAN
  • FTSH_STRPN и CLPX_STRPN
  • HSLU_GEOKA и CLPX_GEOKA
  • HSLU_STAA1 и CLPX_STAA1
    Ортологи:
  • CLPX_CLOTE и CLPX_BACAN
  • HSLU_GEOKA и HSLU_BACAN

    Вернуться на страничку 4 семестра
    © Сливко-Кольчик