- Практикум 1. Филогенетическое дерево
- Практикум 2. Реконструкция филогении
- Практикум 3. Укоренение с использованием внешней группы и бутстреп
Практикум 1. Филогенетическое дерево
Для дальнейшей работы были выбраны несколько видов бактерий:
№ | Название вида | мнемоника |
---|---|---|
1 | Agrobacterium fabrum | AGRFC |
2 | Aromatoleum aromaticum | AROAE |
3 | Neisseria meningitidis | NEIMA |
4 | Polynucleobacter asymbioticus | POLAQ |
5 | Proteus mirabilis | PROMH |
6 | Rhizobium meliloti (он же Sinorhizobium melioti - теперь называется Ensifer melioti) | RHIME |
7 | Roseobacter denitrificans | ROSDO |
8 | Thiobacillus denitrificans | THIDA |
Скобочная формула дерева:
((ROSDO, (AGRFC, RHIME)), (PROMH, (NEIMA, (POLAQ, (AORAE, THIDA)))));
Нетривиальные ветви в этом дереве:
- {RHIME, AGRFC} vs {ROSDO, PROMH, NEIMA, POLAQ, THIDA, AORAE}
- {RHIME, AGRFC, ROSDO} vs {PROMH, NEIMA, POLAQ, THIDA, AORAE}
- {RHIME, AGRFC, ROSDO, PROMH} vs {NEIMA, POLAQ, THIDA, AORAE}
- {RHIME, AGRFC, ROSDO, PROMH, NEIMA, POLAQ} vs {THIDA, AORAE}
Практикум 2. Реконструкция филогении
Задание 1
Не для всех нетривиальных ветвей дерева на NCBI Taxonomy выделяют отдельные клады:
Задание 2
Скачивание последовательностей белка
Выбранная функция – PYRG. Это белок, участвующий в реакции АТФ-зависимого аминирования UTP до CTP.
Получился вот такой запрос:
PYRG_AGRFC, PYRG_AROAE, PYRG_NEIMA, PYRG_POLAQ, PYRG_PROMH, PYRG_RHIME,
PYRG_ROSDO, PYRG_THIDA
В полученном файле для удобства были изменены названия последовательностей
Реконструкция дерева тремя разными способами:
MAFFT → FastME (минимальная эволюция)
Полученное дерево в формате Newick.
Топология дерева получилась правильной, и можно сказать, что молекулярные часы в данном случае работают
довольно неплохо, так как укоренение произошло в правильную ветвь.
MAFFT → TNT (максимальная экономия)
Полученное дерево в формате Newick.
Тут тоже всё верно, только дерево должно быть неукоернённым, но нарисовано с укоренением, видимо, в случайное место, и если его переукоренить в ветвь, отделяющую ROSDO, RHIME и AGRFC от остальных, оно совпадёт с правильным.
Alphaproteobacteria.
MAFFT → PhyML (максимальное правдоподобие)
Полученное дерево в формате Newick.
Тут с видами POLAQ, NEIMA и PROMH какая-то беда, а всё остальное вроде нормально.
Практикум 3. Укоренение и бутстреп
Укоренение с использованием внешней группы
Для укороенения с использованием внешней группы была дополнительно взята последовательность гомологичного белка из Bacillus subtilis – PYRG_BACSU. Для построения дерева я решила использовать конвейер MAFFT → FastME, так как он создал дерево с правильной топологией, в отличие от остальных, а также он считает длины ветвей.
Полученное дерево в формате Newick.
Как и можно было ожидать, укоренение во внешнюю группу, в данном случае, ничего не изменило, так как укоренение изначально произошло верно.
Бутстреп
В данном случае не получится сравнить поддержку правильно реконструированных групп по сравнению с неправильно реконструированными, ни при использовании FastME, ни при использовании TNT, так как в обоих случаях все реконструированные ветви изначально были верными. Также просто исходя из принципа работы бутстрепа, можно предположить, что топология дерева не будет меняться.
Использованный конвейер – MAFFT → FastME + бутстреп, 100 реплик.
Поддежка всех ветвей оказалась довольно высокой, что согласуется с тем, что топология дерева верная.
Построение дерева по нуклеотидным последовательностям
Я реконструировала дерево точно так же, конвейером MAFFT → FastME, но по последовательностям 16S рРНК. Некоторые такие последовательности, которые мне удалось найти, были только частичными.
Как было сказано выше, дерево, изображённое справа, совпало с правильным. Дерево, изображенное слева, отличается от него взаимным расположением листьев POLAQ, THIDA и AORAE. В данном конкретном случае реконструкция по последовательности белка оказалась более удачной, чем реконструкция по последовательности 16S рРНК.
Скачивание последовательностей белка
Выбранная функция – PYRG. Это белок, участвующий в реакции АТФ-зависимого аминирования UTP до CTP.
Получился вот такой запрос:
PYRG_AGRFC, PYRG_AROAE, PYRG_NEIMA, PYRG_POLAQ, PYRG_PROMH, PYRG_RHIME, PYRG_ROSDO, PYRG_THIDA
В полученном файле для удобства были изменены названия последовательностей
Реконструкция дерева тремя разными способами:
MAFFT → FastME (минимальная эволюция)
Полученное дерево в формате Newick.
Топология дерева получилась правильной, и можно сказать, что молекулярные часы в данном случае работают довольно неплохо, так как укоренение произошло в правильную ветвь.
MAFFT → TNT (максимальная экономия)
Полученное дерево в формате Newick.
Тут тоже всё верно, только дерево должно быть неукоернённым, но нарисовано с укоренением, видимо, в случайное место, и если его переукоренить в ветвь, отделяющую ROSDO, RHIME и AGRFC от остальных, оно совпадёт с правильным. Alphaproteobacteria.
MAFFT → PhyML (максимальное правдоподобие)
Полученное дерево в формате Newick.
Тут с видами POLAQ, NEIMA и PROMH какая-то беда, а всё остальное вроде нормально.
Укоренение с использованием внешней группы
Для укороенения с использованием внешней группы была дополнительно взята последовательность гомологичного белка из Bacillus subtilis – PYRG_BACSU. Для построения дерева я решила использовать конвейер MAFFT → FastME, так как он создал дерево с правильной топологией, в отличие от остальных, а также он считает длины ветвей.
Полученное дерево в формате Newick.
Как и можно было ожидать, укоренение во внешнюю группу, в данном случае, ничего не изменило, так как укоренение изначально произошло верно.
Бутстреп
В данном случае не получится сравнить поддержку правильно реконструированных групп по сравнению с неправильно реконструированными, ни при использовании FastME, ни при использовании TNT, так как в обоих случаях все реконструированные ветви изначально были верными. Также просто исходя из принципа работы бутстрепа, можно предположить, что топология дерева не будет меняться.
Использованный конвейер – MAFFT → FastME + бутстреп, 100 реплик.
Поддежка всех ветвей оказалась довольно высокой, что согласуется с тем, что топология дерева верная.
Построение дерева по нуклеотидным последовательностям
Я реконструировала дерево точно так же, конвейером MAFFT → FastME, но по последовательностям 16S рРНК. Некоторые такие последовательности, которые мне удалось найти, были только частичными.
Как было сказано выше, дерево, изображённое справа, совпало с правильным. Дерево, изображенное слева, отличается от него взаимным расположением листьев POLAQ, THIDA и AORAE. В данном конкретном случае реконструкция по последовательности белка оказалась более удачной, чем реконструкция по последовательности 16S рРНК.