Анализ такскономии

Бактерии из предыдущего практикума подверглись анализу таксономии по NCBI Taxonomy.

Название Мнемоника Таксономия
Bifidobacterium longum BIFLO Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Bifidobacteriales; Bifidobacteriaceae; Bifidobacterium
Clavibacter michiganensis CLAMS Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Micrococcales; Microbacteriaceae; Clavibacter
Corynebacterium diphtheriae CORDI Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Corynebacteriales; Corynebacteriaceae; Corynebacterium
Leifsonia xyli LEIXX Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Micrococcales; Microbacteriaceae; Leifsonia
Nocardioides sp. NOCSJ Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Propionibacteriales; Nocardioidaceae; Nocardioides
Rhodococcus jostii RHOJR Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Corynebacteriales; Nocardiaceae; Rhodococcus
Streptomyces avermitilis STRAW Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Streptomycetales; Streptomycetaceae; Streptomyces
Thermobifida fusca THEFY Bacteria; Terrabacteria group; Actinobacteria; Actinomycetia; Streptosporangiales; Nocardiopsaceae; Thermobifida

Для построения дерева нужна скобочная модель в формате newick, а для этого нужно посмотреть какая бактерия кому родственник по данным NCBI. Для решения этой задачи был написан мини-скрипт, по результатам работы скрипта достаточно удобно писать скобочную модель. Чем меньше чиселка внутри листа, тем ближе бактерии друг к другу. Собственно, само число описывает количество отличающихся таксонов для двух бактерий.

Скобочная модель имеет вид: ((CLAMS, LEIXX), (CORDI, RHOJR), BIFLO, NOCSJ, STRAW, THEFY);

Результат построения дерева в Python выдал неукорененное дерево, поэтому скобочная модель была загружена в MEGA, которая, в свою очередь, выдала укорененное дерево:

картинка

Нетривиальные ветви, которые выделяют некоторые таксоны

{CLAMS, LEIXX} vs {CORDI, RHOJR, BIFLO, NOCSJ, STRAW, THEFY} - Microbacteriaceae

Судя по картинке из MEGA, такая нетривиальная ветвь только одна. Однако картинка из питона и NCBI Taxonomy говорят, что есть еще одна нетривиальная ветвь:
{CORDI, RHOJR} vs {CLAMS, LEIXX, BIFLO, NOCSJ, STRAW, THEFY} - Corynebacteriales

Малое количество нетривиальных ветвей, которые выделяют таксоны свидетельствуют о том, что некоторые бактерии достаточно далеки друг от друга по таксономии.