Для дальнейшего изучения среди эукариотических организмов был выбран тутовый шелкопряд (Bombyx mori).
| Характеристика | Значение |
|---|---|
| Идентификатор GenBank | GCA_030269925.2 |
| Идентификатор RefSeq | GCF_030269925.1 |
| Уровень сборки генома | Chromosome |
| Общий размер генома | 461.7 Mb |
| Число фрагментов генома в сборке | 29 |
| N50 для контигов | 16 Mb |
| L50 для контигов | 13 |
| N50 для скэффолдов | 16.9 Mb |
| L50 для скэффолдов | 13 |
Сборка удовлетворяла всем требованиям - имеет аннотированные гены и в RefSeq и в GenBank, качество сборки на уровне Chromosome и является референсным геномом.
Далее была скачена сборка генома, аннотация и предсказанные белковые последовательности шелкопряд.
Для дальнейшей работы был выбран инсулин.
С помощью Advanced Search в NCBI и следующими запросами были получены следующие результаты:
insulin[Protein Name]
insulin[Protein Name] AND biomol_genomic[PROP]
insulin[Protein Name] AND biomol_mrna[PROP]
insulin[Protein Name] AND ddbj_embl_genbank[filter]
insulin[Protein Name] AND refseq[filter]
Всего выдало 1567 результатов, из которых 793 - гены, 767 - мРНК, а среди RefSeq - 1331, GenBank - 236.
insulin[Protein Name] AND "Homo sapiens"[porgn]
insulin[Protein Name] AND "Homo sapiens"[porgn] AND biomol_genomic[PROP]
С помощью ананалогичных дополнений к общему (первому) запросу, получаем всего 12 для человека в общем, из которых 7 для участков генома, а 5 - мРНК, 11 - GenBank, и 1 из RefSeq.
Далее был произведен поиск с помощью Advanced Search на сайте ENA.
tax_tree(9606) AND description="insulin" AND description="mRNA"
tax_tree(9606) AND description="insulin" AND description="gene"
В первом случае выдало 7120 результатов, а во втором - 299.