Практикум №7

Для изучения был выбран карликовый морской конек Hippocampus zosterae

Рисунок 1. Hippocampus zosterae

Таблица 1. Информация о выбранной сборке
Идентификатор GenBank GCA_025434085.3
Идентификатор RefSeq GCF_025434085.1
Уровень сборки генома Chromosome
Общий размер генома 544.5 Mb
Число фрагментов генома в сборке хромосом 21, контигов 291, ,скэффолдов 212
N50 для контигов 22.5 Mb
L50 для контигов 10
N50 для скэффолдов 26 Mb
L50 для скэффолдов 9

L50 - наименьшее число контигов/скэффолдов, в которых содержится половина (50%) всех нуклеотидов сборки.

N50 - длина контига/скэффолда, для которого половина (50%) всех нуклеотидов сборки содержится в контигах/скэффолдах такой и большей длины.

Поисковыe системы ENA и NCBI

Был выбран белок инсулин(Insulin) Далее представлены запросы и описаны результаты этих запросов
insulin[Title] 

45020 записей нуклеотидных баз данных из них посвящено генам 4129, мРНК белков 36529,т.е всего 40658 результатов.Если обобщить использованый запрос:

insulin[Title] AND (biomol_genomic[PROP] OR biomol_mrna[PROP])

Сколько этих записей из RefSeq?

insulin[Protein Name] AND (biomol_genomic[PROP] OR biomol_mrna[PROP]) AND refseq[filter]
Результат 623

Сколько этих записей из GenBank

insulin[Protein Name] AND (biomol_genomic[PROP] OR biomol_mrna[PROP]) AND ddbj_embl_genbank[filter]
Результат 170
insulin[Protein Name] AND (biomol_genomic[PROP] OR biomol_mrna[PROP]) AND refseq[filter] AND "Homo sapiens"[porgn] 
0
insulin[Protein Name] AND (biomol_genomic[PROP] OR biomol_mrna[PROP]) AND ddbj_embl_genbank[filter] AND "Homo sapiens"[porgn]
7
tax_eq(9606) AND description="insulin" AND mol_type="mRNA"
7120
tax_eq(9606) AND description="insulin" AND mol_type="gene"
299