Филогенетическая реконструкция


Построение дерева

Я поступил критически лениво и выбрал первые семь видов из представленной таблички.

Ниже по ним построено древо, его скобочковая форма и нетривиальные ветви указаны под картинкой.

Название Мнемоника
Acidiphilium cryptum ACICJ
Agrobacterium fabrum AGRFC
Aromatoleum aromaticum AROAE
Bartonella henselae BARHE
Bordetella pertussis BORPE
Brucella suis BRUSU
Burkholderia mallei BURMA

fig1
Рис. 1. Филогенетическое древо выбранных бактерий. Скобочковая форма этого дерева:
((((BARHE, BRUSU), AGRFC), ACICJ), ((BURMA, BORPE), AROAE));


Нетривиальные ветви дерева

Я постарался выделить всевозможные нетривиальные ветви у данного дерева, перечислил их ниже.

Дерево также было дополнено названиями таксонов в соотвествии с данными из NCBI taxonomy.


Методы филогенетической реконстукции

Не стал изменять традциям прошлого практикума и выбрал первую же мнемонику функций белков из списка — DAPE. При помощи JalView и базы данных UniProt был получен fasta-файл с последовательностями сукцинилдиаминопимелат-десукцинилазы выбранных бактерий.

Филогенетическая реконструкция производилась на сайте NGPhylogeny.fr тремя алгоритмами: FastME (Distance-based inference of phylogenetic trees, рис. 2, 3), TNT (Phylogenetic analysis under parsimony, рис. 4, 5) и PhyML (Phylogeny software based on the maximum-likelihood, рис. 6) при выравнивании методом MAFFT. Файлы с деревьями можно найти по соответствующим ссылкам: FastME, TNT и PhyML.


Результат метода TNT отличается от двух други и все они втроем отличаются от исходного дерева в практикуме. Не могу однозачно интерпетировать этот результат без детального анализа, но выдвину несколько гипотез. Анализировать длину ветвей не берусь :(


Укоренение с использованием внешней группы

Далее мы сравнивали разные варианты укоренения: укоренение в среднюю точку и при помощи внешней группы (рис. 7). Внешней группой был выбран Helicobacter pylori (HELPY). Новый файл с fasta-последовательностями доступен по ссылке, для построения дерева использовался алгоритм PhyML.

roots
Рис. 7. Укорененные в разные точки деревья. (А) Укоренение в среднюю точку. (В) Укоренение при помощи внешней группы.

К счастью, деревья совсем не отличаются. Также они не отличаются от дерева на рис. 6 за исключением того, что на нем нет Helicobacter pylori. Но не исключено, что мне повезло, и в спорных ситуациях больше следует доверять дереву с укоренением относительно внешней группы.


Bootstrap анализ

Затем дерево было улучшено путем проведения bootstrap анализа со 100 репликами в методе FastME (рис. 8). Для этого использовался тот же набор последовательностей с Helicobacter pylori.

bootstrap
Рис. 8. Укорененные в разные точки деревья. (А) Укоренение в среднюю точку дерево, построенное без поддержки bootstrap. (В) Такое же дерево, но построенное с поддержкой bootstrap.

По топологии деревья не отличаются (что неудивительно, так как строились деревья одним методом с одинаковыми гиперпараметрам). Также если посчитать за правильное дерево из рис. 1, то можно подчеркнуть следующие утверждения.


Построение дерева по нуклеотидным последовательностям

Ранее уже упоминалось, что построенное дерево может быть неправильным из-за того, что мы строили его именно по аминокислотным последовательностям. Чтобы исправить это, было решено построить дерево по 16S rRNA выбранных бактерий (включая Helicobacter pylori). Это дерево так же не факт, что отражает правду, для полной коллекции можно было бы построить еще одно по какой-нибудь некодирующей ДНК последовательности (например, ITS), но задание этого не требует.

Последовательности были взяты из базы данных NCBI и сохранены в fasta-файл. Дерево по ним строилось при помощи FastME с выравнением методом MAFFT, также проводился bootstrap анализ с 1000 реплик (рис. 9).

nucl
Рис. 9. (А) Дерево по нуклеотидным последовательностям 16S rRNA (количество реплик 1000). (B) Дерево по аминокислотным последовательностям (количество реплик 100, дерево из рис. 8B). Newick формула данного дерева:
(HELPY,(AROAE,(BORPE,BURMA)),(ACICJ,(AGRFC,(BARHE,BRUSU))));

Как и ожидалось, это дерево не просто оказалось самым близким к правдивому (рис. 1), но и в принципе совпало с ним! Хотя стоит отметить, что поддержка bootstrap некоторых ветвей не самая высокая