Упр.1.
Выбранный мной организм - плодовая мушка Drosophila melanogaster. Это один из наиболее известных модельных организмов в разных биологических дисциплинах, в особенности в биологии развития. Геном состоит из 3 пар аутосом и пары X/Y хромосом, в нем ~139 млн пар оснований и ~13500 генов (таким образом, набор хромосом диплоидный).
Чтобы найти подходящую сборку генома, я ввел название вида, по моему запросу было найдено 124 генома. Я выбрал тот, который имеет аннотацию в RefSeq.
Уровень сборки - Chromosome. Это значит, что расшифрованы последовательности одной либо нескольких хромосом, причем они могут состоять из контигов или скаффолдов, разделенных нерасшифрованнными промежутками. Также могут иметься нелокализованные скаффолды.
Рис. 1. Drosophila melanogaster (источник)
Упр.2.
RefSeq | GCF_000001215.4 |
GenBank | GCA_000001215.4 |
Размер генома | 137 567 484 п.н. |
Число фрагментов в сборке | 8 |
Contig N50 | 21.5 Mb |
Scaffold N50 | 25.3 Mb |
Contig L50 | 3 |
Scaffold L50 | 3 |
Таким образом, сборка достаточно полно отражает информацию о геноме данного вида, ее размер близок к нормальному размеру генома.
Упр.3.
Файл | Описание содержимого |
GCF_000001215.4_Release_6_plus_ISO1_MT_genomic.fna | Нуклеотидные последовательности генома в формате FASTA |
protein.faa | Последовательности белков в формате FASTA |
genomic.gbff | Последовательности генома с аннотацией в формате GBFF |