Я хотел выбрать интересный и известный мне организм. Mus musculus считается одним из самых широко
используемых модельных организмов в научных исследованиях. Его геном полностью отсеквенирован. Он
насчитывает 21 хромосому и составляет примерно 2,7 гигабазы.
Мышь домашняя (Mus musculus) - широко распространенный грызун из семейства мышиных. Они являются
популярным модельным организмом для биологичских исследований. Живёт не очень долго (пару лет), и, что
самое главное, быстро размножается.
Геном, как и полагается модельному организму, полностью отсеквенирован. Примерно 80% генов совпадают с
человеком.
Mus musculus служит подопытной крысой (почти в прямом смысле) для исследование различных болезней, в том
числе человека.
По поисковому запросу "mus musculus" нашлось 65 сборок генома. Референсная сборка GRCm39 оказалась (неожиданно) уровня Chromosome (собрана до хромосом). Сборка оказалась гаплоидной, собрана 24 Июня 2020. С этой сборкой я и буду работать далее.
Характеристика | RefSeq | GenBank |
---|---|---|
ID | GCF_000001635.27 | GCA_000001635.9 |
Genome size [kd] | 2.7 Gb | 2.7 Gb |
Total unmapped length | 2.7 Gb | 2.7 Gb |
Number of chromosomes | 21 | 21 |
Number of organelles | 1 | 1 |
Number of scaffolds | 101 | 101 |
Scaffold N50 [Mb] | 106.1 | 106.1 |
Scaffold L50 | 11 | 11 |
Number of contigs | 305 | 305 |
Contig N50 [Mb] | 59.5 | 59.5 |
Contig L50 | 15 | 15 |
GC percent | 42 | 42 |
Assembly level | Chromosome | Chromosome |
N50 - это максимальная длина самого короткого контига, такого что когда контиги упорядочены по убыванию длины, контиги размера N50 и более длинные покрывают 50 процентов генома. L50 - минимальное число контигов, которые покрывают 50% генома.