Практикум 3. Реконструкция и укоренение филогенетического дерева, бутстреп


Целью данного практикума было построить для организмов, выбранных в практикуме 1 данного семестра, филогенетическое деревья по последовательностям 12S рРНК (малой митохондриальной РНК) и сравнить его с референсным деревом, полученным в практикуме 1.

Для каждого из организмов была найдена запись митохондриального генома и в этой записи найдены координаты гена 12S рРНК. Например, для организма с мнемоникой ARTSF координаты этого гена в файле записаны как complement(13297..14008), причем complement означает, что ген находится на обратной цепи.

С помощью программы seqret были вырезаны соответствующие последовательности генов по их координатам, а с помощью команды cat эти последовательности были объеденены в один файл rna12.fasta. Ниже приведены примеры двух данных действий для организма с мнемоникой ARTSF:

  • seqret embl:OR423225[13297:14008:r] ARTSF_12S_rRNA.fasta - к координатам добавили :r, поскольку ген на обратной цепи

  • cat ARTSF_12S_rRNA.fasta >> rna12.fasta

Для организма Caenorhabditis elegans не было найдено последовательности 12S рРНК, поэтому он был заменен на организм того же рода - Caenorhabditis brenneri, имеющий мнемонику CAEBE

Далее было построено выравнивание с помощью программы muscle: muscle -align rna12.fasta -output rna12-alignment.fasta, которое было переформатировано в формат phylip-relaxed кодом из прошлого практикума

С помощью программы fastme было построено филогенетическое дерево. Так как на вход подавались нуклеотидные последовательности, программа запускалась с опцией -d: fastme -d -i rna12.phy -o rna12.tre. Поскольку целью практикума было также потренироваться в использовании bootstrap, к полученному дереву была применен метод bootstrap для проверки его достоверности на этапе запуска программы fastme: fastme -d -i rna12.phy -o rna12_bootstrap.tre -b 100. Полученное дерево изображено ниже.


Рис.1 Дерево, построенное fastme по последовательностям 12S рРНК с применением bootstrap

Бутстреп-поддержка ветвей оказалась низкой, особенно для неправильно реконструированных ветвей с Членистоногими (ANOGA - Anopheles gambiae, DROME - Drosophila melanogaster, APILI - Apis mellifera, ARTSF - Artemia franciscana). Любопытно, что верно реконструированные с точки зрения современной филогенетики ветви с позвоночными (ISUOX - Isurus oxyrinchus, SALSA - Salmo salar, BOSCO - Boa constrictor, CORBR - Corvus brachyrhynchos, LANLU - Lanius ludovicianus) имеют низкую бутстреп-поддержку. Одна из ветвей (ANOGA) обращена в противоположную сторону, что очень смутило меня. Посмотрев на визуализацию выравнивания, я увидела довольно большое число гэпов, что вероятно связано с дальней степенью родства выбранных мной организмов. Далее я попробовала ещё раз запустить fastme с теми же опциями и параметрами bootstrap, но добавив опцию -r, убирающую гэпы. Результат визуализации в iTOL приведен ниже:


Рис.2 Дерево, построенное fastme по последовательностям 12S рРНК с применением bootstrap и удалением гэпов

В полученном при удалении гэпов дереве многие ветви имеют максимальную bootstrap-поддержку (100), однако с точки зрения систематики некоторые из ветвей с такой поддержкой реконструированы неверно (ветвь с ракообразным ARTSF отходит правее группы насекомых, хотя по систематике должна отходить левее; ветвь с удавом BOSCO отходит раньше ветвей с рыбами ISUOX и SALSA).


Для дерева, построенного по последовательностям 12S рРНК было произведено укоренение во внешнюю группу. В качестве внешней группы был выбран организм Mnemiopsis leidyi с мнемоникой MNELE. Из файла с митохондриальной ДНК этого организма был вырезан ген 12S рРНК по его координатам: seqret embl:JF760210[3153:3520] MNELE_12S_rRNA.fasta и добавлен в файл rna12.fasta

Далее программой muscle было проведено выравнивание и описанным выше способом с помощью fastme построено дерево с удалением гэпов: fastme -d -r -i rna12-rooted.phy -o rna12_bootstrap.tre -b 100. Полученное дерево, укорененное в ветвь, ведующую к внешней группе, показано ниже:


Рис.3 Дерево, построенное fastme по последовательностям 12S рРНК с укоренением во внешнюю группу, применением bootstrap и удалением гэпов

Бутстреп-поддержка большинства ветвей также оказалась равна 100, однако с точки зрения систематики некоторые из ветвей реконструированы неверно, например ветви с членистоногими и ветви с позвоночными (с позвоночными проблема оказалась такой же, как и в дереве на рисунке 2)