Целью данного практикума было построить для организмов, выбранных в практикуме 1 данного семестра, филогенетическое деревья по последовательностям 12S рРНК (малой митохондриальной РНК) и сравнить его с референсным деревом, полученным в практикуме 1.
Для каждого из организмов была найдена запись митохондриального генома и в этой записи найдены координаты гена 12S рРНК. Например, для организма с мнемоникой ARTSF координаты этого гена в файле записаны как complement(13297..14008), причем complement означает, что ген находится на обратной цепи.
С помощью программы seqret были вырезаны соответствующие последовательности генов по их координатам, а с помощью команды cat эти последовательности были объеденены в один файл rna12.fasta. Ниже приведены примеры двух данных действий для организма с мнемоникой ARTSF:
seqret embl:OR423225[13297:14008:r] ARTSF_12S_rRNA.fasta
- к координатам добавили :r, поскольку ген на обратной цепи
cat ARTSF_12S_rRNA.fasta >> rna12.fasta
Для организма Caenorhabditis elegans не было найдено последовательности 12S рРНК, поэтому он был заменен на организм того же рода - Caenorhabditis brenneri, имеющий мнемонику CAEBE
Далее было построено выравнивание с помощью программы muscle: muscle -align rna12.fasta -output rna12-alignment.fasta
, которое было переформатировано в формат phylip-relaxed кодом из прошлого практикума
С помощью программы fastme было построено филогенетическое дерево. Так как на вход подавались нуклеотидные последовательности, программа запускалась с опцией -d: fastme -d -i rna12.phy -o rna12.tre
. Поскольку целью практикума было также потренироваться в использовании bootstrap, к полученному дереву была применен метод bootstrap для проверки его достоверности на этапе запуска программы fastme: fastme -d -i rna12.phy -o rna12_bootstrap.tre -b 100
. Полученное дерево изображено ниже.
Бутстреп-поддержка ветвей оказалась низкой, особенно для неправильно реконструированных ветвей с Членистоногими (ANOGA - Anopheles gambiae, DROME - Drosophila melanogaster, APILI - Apis mellifera, ARTSF - Artemia franciscana). Любопытно, что верно реконструированные с точки зрения современной филогенетики ветви с позвоночными (ISUOX - Isurus oxyrinchus, SALSA - Salmo salar, BOSCO - Boa constrictor, CORBR - Corvus brachyrhynchos, LANLU - Lanius ludovicianus) имеют низкую бутстреп-поддержку. Одна из ветвей (ANOGA) обращена в противоположную сторону, что очень смутило меня. Посмотрев на визуализацию выравнивания, я увидела довольно большое число гэпов, что вероятно связано с дальней степенью родства выбранных мной организмов. Далее я попробовала ещё раз запустить fastme с теми же опциями и параметрами bootstrap, но добавив опцию -r, убирающую гэпы. Результат визуализации в iTOL приведен ниже:
В полученном при удалении гэпов дереве многие ветви имеют максимальную bootstrap-поддержку (100), однако с точки зрения систематики некоторые из ветвей с такой поддержкой реконструированы неверно (ветвь с ракообразным ARTSF отходит правее группы насекомых, хотя по систематике должна отходить левее; ветвь с удавом BOSCO отходит раньше ветвей с рыбами ISUOX и SALSA).
Для дерева, построенного по последовательностям 12S рРНК было произведено укоренение во внешнюю группу. В качестве внешней группы был выбран организм Mnemiopsis leidyi с мнемоникой MNELE. Из файла с митохондриальной ДНК этого организма был вырезан ген 12S рРНК по его координатам: seqret embl:JF760210[3153:3520] MNELE_12S_rRNA.fasta
и добавлен в файл rna12.fasta
Далее программой muscle было проведено выравнивание и описанным выше способом с помощью fastme построено дерево с удалением гэпов: fastme -d -r -i rna12-rooted.phy -o rna12_bootstrap.tre -b 100
. Полученное дерево, укорененное в ветвь, ведующую к внешней группе, показано ниже:
Бутстреп-поддержка большинства ветвей также оказалась равна 100, однако с точки зрения систематики некоторые из ветвей реконструированы неверно, например ветви с членистоногими и ветви с позвоночными (с позвоночными проблема оказалась такой же, как и в дереве на рисунке 2)