Практикум №3

Реконструкция дерева по нуклеотидным последовательностям (12S rRNA)

Для каждого вида были найдены полные митохондриальные геномы в базе ENA. Далее по координатам, указанным в аннотации, был вырезан ген 12S рРНК.

Для Drosophila simulans последовательность 12S рРНК не была обнаружена, поэтому взяли последовательность близкородственного вида Drosophila willistoni.

Вид Мнемоника Accession номер (митохондриальный геном) Координаты 12S rRNA
Artemia franciscanaARTSFX69067complement(13289..14000)
Tetrodontophora bielanensisTETBIAY653001[1..274]
Apis ligusticaAPILIMH341407[14763..15547]
Samia riciniSAMRIJN215366complement(14245..15023)
Anopheles gambiaeANOGAMG753662complement(14045..14844)
Aedes aegyptiAEDAEOR413794complement(14366..15155)
Anopheles quadrimaculatusANOQUPQ613902complement(5709..6503)
Cochliomyia hominivoraxCOLHOFM867729[1..644]
Drosophila melanogasterDROMEX97155[ 1..688 ]
Drosophila willistoniSPASTX97154[1..665]
Drosophila subobscuraDROSUMG421014complement(14157..14938)

Все полученные файлы с последовательностями были объединены в один файл:

cat *_12S.fasta > all_12S.fasta

Далее необходимо выровнять эти последовательностями, воспользуемся следующей командой:

muscle -align 
all_12S_rRNA.fasta -output 12S_all_aligment.fasta
Выдача

Необходимо перевести выравнивания в единственный формат, который воспринимается программой FastME ("phylip-relaxed").

Была написана программа, берующая на вход выравнивание в формате fasta и выдающая выравнивание в формате phylip-relaxed.

Выдача

Будем использовать программу IQ-TREE. Эта программа использует метод максимального правдоподобия, то есть сама ищет наиболее вероятную модель эволюции, которая больше подходит под наши последовательности, также она сама определяет тип данных, поэтому воспользуемся командой:

iqtree -s 12S.phy

Программа создает несколько файлов, нужный нам - файл со скобочной формулой дерева

Рис.1 Изображение филогенетического дерева, построенного программой FastME по методу p-distance, с помощью iTOL
Рис.2 Изображение филогенетического дерева по цитохрому В, построенного программой IQ-TREE, с помощью iTOL
Рис.3 Изображение филогенетического дерева, построенного по таксономии, с помощью iTOL
Рис.4 Изображение филогенетического дерева по 12S rRNA, построенного программой IQ-TREE, с помощью iTOL

Во всех реконструированных деревьях ракообразные (ARTSF) отделяются от остальных организмов, что подтверждает правильность укоренения. Однако ни один метод не поместил TETBI (паукообразных) отдельно от насекомых. В дереве FastME p-distance наблюдаются наибольшие изменения: DROSU отделилась от других дрозофил и объединилась с APILI, а COLHO оказалась внутри клады дрозофил. IQ-TREE по цитохрому B показал лучший результат среди реконструированных деревьев — комары и дрозофилы собраны правильно, хотя TETBI по-прежнему внутри насекомых. Дерево по 12S rRNA содержит наибольшие изменения: AEDAE отделился от других комаров и образовал кладу с APILI и COLHO, а TETBI объединился с SAMRI. Таким образом, цитохром B восстанавливает филогению точнее, чем 12S rRNA.

Укоренение во внешнюю группу

Все исследуемые в работе виды относятся к типу Членистоногие, поэтому в качестве внешней группы была выбрана мышь Mus musculus.

Вид Таксономия Мнемоника
Mus musculus Eumetazoa; Bilateria; Deuterostomia; Chordata; Craniata; Vertebrata; Gnathostomata; Teleostomi; Euteleostomi; Sarcopterygii; Dipnotetrapodomorpha; Tetrapoda; Amniota; Mammalia; Theria; Eutheria; Rodentia; Muridae; Mus MOUSE

Для построения дерева по цитохрому использовались те же шаги, что и в практикуме 2, но к старым группам была добавлена последовательность цитохрома В мыши. Для выполнения этой части практикума тоже использовалась программа iqtree

Скобочная формула

Рис.5 Изображение филогенетического дерева, построенного по цитохрому В программой IQ-TREE с включением внешней группы Mus musculus, с помощью iTOL

Дерево укоренено на ветви, ведущей к внешней группе. Видно, что внешняя группа отделилась от всех членистоногих, что соответствует ожиданиям.

Бутстреп

Для оценки достоверности отдельных ветвей дерева был выполнен бутстреп-анализ с использованием программы FastME. Было задано 100 бутстреп-реплик, и использовалось выравнивание по цитохрому B.

fastme -i ../../cyb.phy -pM -o cyb_bootstrep_trev.tre -b 100

Рис.6 Изображение филогенетического дерева по цитохрому В, построенного программой FastME по методу MtREV, с помощью iTOL

Ветвь, отделяющая ARTSF, имеет поддержку 48%. Это средний показатель относительно разделения внутри ветви, что говорит о ненадежности положения ракообразных.

Клада дрозофил (DROME, DROWI, DROSU) имеет поддержку 69%.

Клада комаров (ANOGA, AEDAE, ANOQU) имеет поддержку 100%.

Ошибочное положение TETBI внутри насекомых имеет поддержку 48%, что свидетельствует о невысокой достоверности данных в этом месте.