1. Практикум 1. Филогенетическое дерево
  2. Практикум 2. Реконструкция филогении
  3. Практикум 3. Укоренение с использованием внешней группы и бутстреп

Практикум 1. Филогенетическое дерево

Для дальнейшей работы были выбраны несколько видов бактерий:

Таблица 1 Названия и мнемоники выбранных бактерий
Название вида мнемоника
1 Agrobacterium fabrum AGRFC
2 Aromatoleum aromaticum AROAE
3 Neisseria meningitidis NEIMA
4 Polynucleobacter asymbioticus POLAQ
5 Proteus mirabilis PROMH
6 Rhizobium meliloti (он же Sinorhizobium melioti - теперь называется Ensifer melioti) RHIME
7 Roseobacter denitrificans ROSDO
8 Thiobacillus denitrificans THIDA

Скобочная формула дерева:


      ((ROSDO, (AGRFC, RHIME)), (PROMH, (NEIMA, (POLAQ, (AORAE, THIDA)))));

Рис. 1.1 Изображение дерева

Нетривиальные ветви в этом дереве:

  1. {RHIME, AGRFC} vs {ROSDO, PROMH, NEIMA, POLAQ, THIDA, AORAE}
  2. {RHIME, AGRFC, ROSDO} vs {PROMH, NEIMA, POLAQ, THIDA, AORAE}
  3. {RHIME, AGRFC, ROSDO, PROMH} vs {NEIMA, POLAQ, THIDA, AORAE}
  4. {RHIME, AGRFC, ROSDO, PROMH, NEIMA, POLAQ} vs {THIDA, AORAE}

      




      

Практикум 2. Реконструкция филогении

Задание 1

Не для всех нетривиальных ветвей дерева на NCBI Taxonomy выделяют отдельные клады:

Рис. 2.1 Изображение дерева с подписями

Задание 2

  1. Скачивание последовательностей белка

    Выбранная функция – PYRG. Это белок, участвующий в реакции АТФ-зависимого аминирования UTP до CTP.

    Получился вот такой запрос:

    
         PYRG_AGRFC, PYRG_AROAE, PYRG_NEIMA, PYRG_POLAQ, PYRG_PROMH, PYRG_RHIME,
         PYRG_ROSDO, PYRG_THIDA 
    
    
  2. В полученном файле для удобства были изменены названия последовательностей

  3. Реконструкция дерева тремя разными способами:

    • MAFFT → FastME (минимальная эволюция)

      Полученное дерево в формате Newick.

      Топология дерева получилась правильной, и можно сказать, что молекулярные часы в данном случае работают довольно неплохо, так как укоренение произошло в правильную ветвь.

      Рис. 2.2 Изображение неукоренённого реконструированного дерева
      Рис. 2.3 Изображение реконструированного дерева, укоренённого в середину
    • MAFFT → TNT (максимальная экономия)

      Полученное дерево в формате Newick.

      Тут тоже всё верно, только дерево должно быть неукоернённым, но нарисовано с укоренением, видимо, в случайное место, и если его переукоренить в ветвь, отделяющую ROSDO, RHIME и AGRFC от остальных, оно совпадёт с правильным. Alphaproteobacteria.

      Рис. 2.4 Изображение неукоренённого реконструированного дерева
    • MAFFT → PhyML (максимальное правдоподобие)

      Полученное дерево в формате Newick.

      Тут с видами POLAQ, NEIMA и PROMH какая-то беда, а всё остальное вроде нормально.

      Рис. 2.5 Изображение неукоренённого реконструированного дерева
      Рис. 2.6 Изображение реконструированного дерева, укоренённого в середину

Практикум 3. Укоренение и бутстреп

  1. Укоренение с использованием внешней группы

    Для укороенения с использованием внешней группы была дополнительно взята последовательность гомологичного белка из Bacillus subtilisPYRG_BACSU. Для построения дерева я решила использовать конвейер MAFFT → FastME, так как он создал дерево с правильной топологией, в отличие от остальных, а также он считает длины ветвей.

    Полученное дерево в формате Newick.

    Рис. 3.1 Изображение дерева, укорренённого в ветвь, ведущую к внешней группе

    Как и можно было ожидать, укоренение во внешнюю группу, в данном случае, ничего не изменило, так как укоренение изначально произошло верно.

  2. Бутстреп

    В данном случае не получится сравнить поддержку правильно реконструированных групп по сравнению с неправильно реконструированными, ни при использовании FastME, ни при использовании TNT, так как в обоих случаях все реконструированные ветви изначально были верными. Также просто исходя из принципа работы бутстрепа, можно предположить, что топология дерева не будет меняться.

    Использованный конвейер – MAFFT → FastME + бутстреп, 100 реплик.

    Рис. 3.2 Дерево, укоренённое в середину; поддержка ветвей указана под соответствующими ветвями.

    Поддежка всех ветвей оказалась довольно высокой, что согласуется с тем, что топология дерева верная.

  3. Построение дерева по нуклеотидным последовательностям

    Я реконструировала дерево точно так же, конвейером MAFFT → FastME, но по последовательностям 16S рРНК. Некоторые такие последовательности, которые мне удалось найти, были только частичными.

    Рис. 3.3 Дерево, реконструированное по последовательности 16S рРНК (слева) и по последовательности белка PYRG (справа). Оба дерева реконструированиы с помощью конвейера MAFFT → FastME и укоренены в среднюю точку.

    Как было сказано выше, дерево, изображённое справа, совпало с правильным. Дерево, изображенное слева, отличается от него взаимным расположением листьев POLAQ, THIDA и AORAE. В данном конкретном случае реконструкция по последовательности белка оказалась более удачной, чем реконструкция по последовательности 16S рРНК.