Занятие 2. Моделирование и реконструкция эволюции гена

  1. Дерево, описанное формулой: (((А:90,B:90):15,C:80):20,((D:50,E:50):4,F:70):30);
  2. *Дерево не ультраметрично: не существует точки, равноудаленной от всех листьев.

  3. Описание ветвей этого дерева как разбиения множества листьев (считая дерево бескорневым):
  4. A B C D E F
    . . * * * * 
    . . . * * *
    . . . * * .
    

  5. Моделирование эволюции гена ilvC
  6. Получим искуственные мутантные последовательности, соответствующие листьям и узлам дерева (в корне находится последовательность гена белка ILVC_ECOLI) с помощью скрипта:
    msbar m.fasta 11mut.fasta -point 4 -count 295 -auto
    msbar m.fasta 12mut.fasta -point 4 -count 443 -auto
    msbar 11mut.fasta Cmut.fasta -point 4 -count 1181 -auto
    msbar 11mut.fasta 21mut.fasta -point 4 -count 221 -auto
    msbar 21mut.fasta Amut.fasta -point 4 -count 1328 -auto
    msbar 21mut.fasta Bmut.fasta -point 4 -count 1328 -auto
    msbar 12mut.fasta 22mut.fasta -point 4 -count 59 -auto
    msbar 12mut.fasta Fmut.fasta -point 4 -count 1033 -auto
    msbar 22mut.fasta Dmut.fasta -point 4 -count 738 -auto
    msbar 22mut.fasta Emut.fasta -point 4 -count 738 -auto
    
    Где m.fasta - исходная последовательность, кодирующая белок ILVC_ECOLI, длины 1476 нуклеотидов. Point - это тип произведенных мутаций: 0 - нет мутации, 1 - любая из пяти последующих, 2 - вставки, 3 - делеции, 4 - замены, 5 - дупликации, 6 - перестановки. Число замен рассчитывалось по формуле
    [длина посл-ти*длина ветви]/100
    
    

  7. Реконструкция эволюции гена ilvC
    • Алгоритм максимального правдоподобия (значение ttratio - это отношение числа транзиций к числу трансверсий, т. е. выбор эволюционной модели)
      fdnaml ALL.fasta -ttratio 1 -auto
        +----------------------B
        |
        |              +---------------F
        |     +--------4
        |     |        |   +------------E
        1-----2        +---3
        |     |            +------------D
        |     |
        |     +-------------------C
        |
        +--------------------A
      
      
    • Алгоритм UPGMA (строит укорененное дерево)
      fdnadist ALL.fasta -ttratio 1 -auto
      fneighbor all.fdnadist -treetype u -auto
                 +-------------------------------------------A
        +--------3
        !        +-------------------------------------------B
      --5
        !      +---------------------------------------------C
        !      !
        +------4                    +------------------------D
               !              +-----1
               +--------------2     +------------------------E
                              !
                              +------------------------------F
      
      
      Заметим, что дерево укоренено неверно - на исходном дереве корень рядом с 4-ым узлом.
    • Алгоритм Neighbor-joining
      fdnadist ALL.fasta -ttratio 1 -auto
      fneighbor all.fdnadist -auto
                    
        +-----------------------B
        !
        !     +-------------------C
        !     !
        1-----2             +------------D
        !     !          +--3
        !     +----------4  +-----------E
        !                !
        !                +---------------F
        !
        +-------------------A
      

      Cравнение топологии полученных деревьев:

      A B C D E F
      ИсходноеМаксимального правдоподобияUPGMANeighbor-joining
      . . * * * *
      ++++
      . . . * * *
      ++++
      . . . * * .
      ++++
      ИТОГО: топология деревьев совпадает, т. е. все алгоритмы правильно реконстрировали исходное дерево (если считать UPGMA дерево бескорневым).

Назад

На главную

© Поздышев Д.