Практикум 7: Нуклеотидные банки данных

Выбор сборки

Для исследования я хотел выбрать Дозорщика-императора (одна из самых крупных стрекоз России). Однако, поиск по запросу "Anax imperator (emperor dragonfly)" не дал никаких результатов, поэтому я выбрал cборку для Тонкохвоста изящного (Ischnura elegans),так как она первая наиболее аннотированная по запросу "Odonata".

Тонкохвосты - это мелкие или очень мелкие стрекозы с тонким брюшком и прозрачными крыльями. Распространены по всей европейской части России. Данных о числе хромосом найти не удалось.

”kjhg”
рис.1 Ischnura elegans. Автор фотографии: Jörg Hempel

Уровень сборки (ioIscEleg1.1 ) - хромосомный.

Характеристики сборки

Табл.1 Харастеристики сборок
RefSeq GenBank
Сборка GCF_921293095.1 GCA_921293095.1
Размер генома, п.н. 1 700 000 000 1 000 000 000
Число хромосом 14 14
Число органелл 0 1
Число скэффолдов 110 110
N50 скэффолдов, Mb 123.6 123.6
L50 скэффолдов 7 7
Число контигов 359 359
N50 контигов, Mb 13.1 13.1
L50 контигов 36 36

N50 - размер контига, для которого 50% нуклеотидов сборки содержатся в контигах такой же и большей длинны. L50 - наименьшее число контигов, содержащее 50% нуклеотидов (для скэффолдо аналогично).

То что сборка аннотирована и анализ BUSCO показывает её высокое качество, позволяет сказать что сборка отражает биологическую информацию о геноме выбранного организма.

Файлы с информацией о сборке

GCF_921293095.1_ioIscEleg1.1_genomic.fna.gz - нуклеотидные последовательности генома

GCF_921293095.1_ioIscEleg1.1_genomic.gbff.gz - последовательности генома с аннотацией

GCF_921293095.1_ioIscEleg1.1_protein.faa.gz - последовательности белков

Источники

Описание стрекозы согласно сайту ecosystema.ru