Для выполнения задание была выбрана сборка генома Канадского бобра - American Beaver (Castor canadensis). Сборка аннотирована по RefSeq и имеет качество на уровне Chromosome.
| Параметр | Значение |
|---|---|
| Идентификатор GenBank | GCA_047511655.2 |
| Идентификатор RefSeq | GCF_047511655.1 |
| Уровень сборки генома | Chromosome |
| Общий размер генома | 2814832999 |
| Число фрагментов генома в сборке | 20 хромосом, 181 скэффолд, 362 контига |
| Параметры N50 и L50 для всех элементов | Scaffold N50 159 Mb Scaffold L50 8 Contig N50 59.4 Mb Contig L50 16 |
Для выполнения задания был выбран белок каталаза. Всего в базе данных нашлось 12837 записи с этим белком в названии (запрос: 'catalase[title]'). 7383 из них посвящены мРНК (3835 записей из RefSeq и 3548 из GenBank). Записей посвященным генам нашлось 5172 (только 1 запись из RefSeq, остальное из GenBank). 155 записей описывают последовательности человека (25 записей об участки генома, все, кроме одной из GenBank, 127 посвящены мРНК, соотношение записей относительно источника то же).
Не все записи из выдачи содержат последовательности, кодирующие каталазу. Так, на последних страницах выдачи можно увидить записи о геномной последовательности Gallus gallus, подобной каталазе, микросаттелитном маркере рядом с каталазой и пр.
В базе данных ENA нашлось 125 записей с каталазой в названии, описывающих мРНК человека и ни одной записи о геномной ДНК (использовались запросы 'tax_division="HUM" AND mol_type="mrna" description="catalase"' и 'tax_division="HUM" AND mol_type="genomic dna" description="catalase"' соответственно).