Я искала сборку генома большой панды - Ailuropoda melanoleuca (giant panda). Бамбуковый медведь - вид всеядных млекопитающих из семейства медвежьих, они имеют черно-белую окраску и обладают признаками енота. Когда-то их называли пятнистым медведем. У большой панды 42 хромосомы.
На сайте NCBI в поисковую строку был введен запрос: Ailuropoda melanoleuca (giant panda). По нему было найдено 3 сборки.
Я выбрала первую сборку (Genome assembly ASM200744v3), уровень этой сборки - Chromosome. Это означает, что имеется последовательность для одной или нескольких хромосом. Это может быть полностью секвенированная хромосома без пробелов или хромосома, содержащая скаффолды или контиги с пробелами между ними. Также могут присутствовать неразмещенные или нелокализованные скаффолды. Выбранная мной сборка является референсной (референсный геном - отобранная вручную высококачественная сборка генома, которую NCBI и эксперты определили, как важную в качестве стандарта, с которым сравниваются другие данные)
Assembly | Genome size | Number of chromosomes | Number of scaffolds | Scaffold N50 | Scaffold L50 | Number of contigs | Contig N50 | Contig L50 | Assembly level | |
---|---|---|---|---|---|---|---|---|---|---|
GenBank | GCA_002007445.3 | 2.4 Gb | 21 | 73,513 | 129.2 Mb | 8 | 122,819 | 127.7 kb | 5,332 | Chromosome |
RefSeq | GCF_002007445.2 | 2.4 Gb | 21 | 73,513 | 129.2 Mb | 8 | 122,819 | 127.7 kb | 5,332 | Chromosome |
Параметр N50 обозначает длину контига, для которого 50% всех нуклеотидов сборки в контигах такий и большей длины. Параметр L50 обозначает наименьшее число контигов, в которых содержится 50% всех нуклеотидов данной сборки
C сайта NCBI были скачаны файлы со сборкой генома, последовательностью генома с аннотацией и последовательностью белков