Практикум 7

Выбор сборки

Я хотел выбрать интересный и известный мне организм. Mus musculus считается одним из самых широко используемых модельных организмов в научных исследованиях. Его геном полностью отсеквенирован. Он насчитывает 21 хромосому и составляет примерно 2,7 гигабазы.

Мышь домашняя (Mus musculus) - широко распространенный грызун из семейства мышиных. Они являются популярным модельным организмом для биологичских исследований. Живёт не очень долго (пару лет), и, что самое главное, быстро размножается.
Геном, как и полагается модельному организму, полностью отсеквенирован. Примерно 80% генов совпадают с человеком.
Mus musculus служит подопытной крысой (почти в прямом смысле) для исследование различных болезней, в том числе человека.

Mus Musculus

Mus Musculus

По поисковому запросу "mus musculus" нашлось 65 сборок генома. Референсная сборка GRCm39 оказалась (неожиданно) уровня Chromosome (собрана до хромосом). Сборка оказалась гаплоидной, собрана 24 Июня 2020. С этой сборкой я и буду работать далее.

Характеристики сборки

Таблица 1. Характеристики сборки
Характеристика RefSeq GenBank
ID GCF_000001635.27 GCA_000001635.9
Genome size [kd] 2.7 Gb 2.7 Gb
Total unmapped length 2.7 Gb 2.7 Gb
Number of chromosomes 21 21
Number of organelles 1 1
Number of scaffolds 101 101
Scaffold N50 [Mb] 106.1 106.1
Scaffold L50 11 11
Number of contigs 305 305
Contig N50 [Mb] 59.5 59.5
Contig L50 15 15
GC percent 42 42
Assembly level Chromosome Chromosome

N50 - это максимальная длина самого короткого контига, такого что когда контиги упорядочены по убыванию длины, контиги размера N50 и более длинные покрывают 50 процентов генома. L50 - минимальное число контигов, которые покрывают 50% генома.

Скачивание генома

Геном быс успешно скачан на мой компьютер