Практикум 7

Выбор сборки генома эукариотического организма

Для дальнейшего изучения среди эукариотических организмов был выбран тутовый шелкопряд (Bombyx mori).

img1
Рисунок 1. Тутовый шелкопряд.
Таблица 1. Идентификаторы генома. Дополнение к описанию - N50 является длиной последнего самого длинного контига после достижение половины(50%) полного разимера. L50 же является количеством самых длинных контигов после достижение половины(50%) полного размера.
Характеристика Значение
Идентификатор GenBank GCA_030269925.2
Идентификатор RefSeq GCF_030269925.1
Уровень сборки генома Chromosome
Общий размер генома 461.7 Mb
Число фрагментов генома в сборке 29
N50 для контигов 16 Mb
L50 для контигов 13
N50 для скэффолдов 16.9 Mb
L50 для скэффолдов 13

Сборка удовлетворяла всем требованиям - имеет аннотированные гены и в RefSeq и в GenBank, качество сборки на уровне Chromosome и является референсным геномом.

Далее была скачена сборка генома, аннотация и предсказанные белковые последовательности шелкопряд.

Работа с поисковыми системами ENA и NCBI

Для дальнейшей работы был выбран инсулин.

С помощью Advanced Search в NCBI и следующими запросами были получены следующие результаты:

insulin[Protein Name]

insulin[Protein Name] AND biomol_genomic[PROP]

insulin[Protein Name] AND biomol_mrna[PROP]

insulin[Protein Name] AND ddbj_embl_genbank[filter]

insulin[Protein Name] AND refseq[filter]

Всего выдало 1567 результатов, из которых 793 - гены, 767 - мРНК, а среди RefSeq - 1331, GenBank - 236.

insulin[Protein Name] AND "Homo sapiens"[porgn]

insulin[Protein Name] AND "Homo sapiens"[porgn] AND biomol_genomic[PROP]

С помощью ананалогичных дополнений к общему (первому) запросу, получаем всего 12 для человека в общем, из которых 7 для участков генома, а 5 - мРНК, 11 - GenBank, и 1 из RefSeq.

Далее был произведен поиск с помощью Advanced Search на сайте ENA.

tax_tree(9606) AND description="insulin" AND description="mRNA"

tax_tree(9606) AND description="insulin" AND description="gene"

В первом случае выдало 7120 результатов, а во втором - 299.