Учебный сайт Ивана Федорова


Практикум 7

Упр.1.

Выбранный мной организм - плодовая мушка Drosophila melanogaster. Это один из наиболее известных модельных организмов в разных биологических дисциплинах, в особенности в биологии развития. Геном состоит из 3 пар аутосом и пары X/Y хромосом, в нем ~139 млн пар оснований и ~13500 генов (таким образом, набор хромосом диплоидный).

Чтобы найти подходящую сборку генома, я ввел название вида, по моему запросу было найдено 124 генома. Я выбрал тот, который имеет аннотацию в RefSeq.

Уровень сборки - Chromosome. Это значит, что расшифрованы последовательности одной либо нескольких хромосом, причем они могут состоять из контигов или скаффолдов, разделенных нерасшифрованнными промежутками. Также могут иметься нелокализованные скаффолды.

Bootstrap

Рис. 1. Drosophila melanogaster (источник)

Упр.2.

RefSeq GCF_000001215.4
GenBank GCA_000001215.4
Размер генома 137 567 484 п.н.
Число фрагментов в сборке 8
Contig N50 21.5 Mb
Scaffold N50 25.3 Mb
Contig L50 3
Scaffold L50 3

Таким образом, сборка достаточно полно отражает информацию о геноме данного вида, ее размер близок к нормальному размеру генома.

Упр.3.

Файл Описание содержимого
GCF_000001215.4_Release_6_plus_ISO1_MT_genomic.fna Нуклеотидные последовательности генома в формате FASTA
protein.faa Последовательности белков в формате FASTA
genomic.gbff Последовательности генома с аннотацией в формате GBFF