Практикум 7.

Задание 1.

Для выполнения задание была выбрана сборка генома Канадского бобра - American Beaver (Castor canadensis). Сборка аннотирована по RefSeq и имеет качество на уровне Chromosome.

Параметр Значение
Идентификатор GenBank GCA_047511655.2
Идентификатор RefSeq GCF_047511655.1
Уровень сборки генома Chromosome
Общий размер генома 2814832999
Число фрагментов генома в сборке 20 хромосом,
181 скэффолд,
362 контига
Параметры N50 и L50 для всех элементов Scaffold N50 159 Mb
Scaffold L50 8
Contig N50 59.4 Mb
Contig L50 16

Задание 2.

Для выполнения задания был выбран белок каталаза. Всего в базе данных нашлось 12837 записи с этим белком в названии (запрос: 'catalase[title]'). 7383 из них посвящены мРНК (3835 записей из RefSeq и 3548 из GenBank). Записей посвященным генам нашлось 5172 (только 1 запись из RefSeq, остальное из GenBank). 155 записей описывают последовательности человека (25 записей об участки генома, все, кроме одной из GenBank, 127 посвящены мРНК, соотношение записей относительно источника то же).

Не все записи из выдачи содержат последовательности, кодирующие каталазу. Так, на последних страницах выдачи можно увидить записи о геномной последовательности Gallus gallus, подобной каталазе, микросаттелитном маркере рядом с каталазой и пр.

В базе данных ENA нашлось 125 записей с каталазой в названии, описывающих мРНК человека и ни одной записи о геномной ДНК (использовались запросы 'tax_division="HUM" AND mol_type="mrna" description="catalase"' и 'tax_division="HUM" AND mol_type="genomic dna" description="catalase"' соответственно).