1. Выбор эукариота и сборки его геномa

Всего по запросу Canis lupus (wolf) в NCBI Datasets нашлось 34 сборки генома. С помощью фильтрации “Reference genomes”, “Annotated genomes”, “Assembly level” - Chromosome/Complete, нашлись 3 референсные аннотированные сборки, соответсвующие 3 подвидам серого волка (Canis lupus). Далее в работе будет рассматриваться наиболее свежая сборка генома (Февраль, 2025) мексиканского подвида - mCanLup2.hap1. Гаплоидный набор самца содержит 40 хромосом (38 аутосом и половые XY).

Canis lupus baileyi (мексиканский волк) представляет собой наиболее южный подвид серого волка в Северной Америке. От других подвидов серых волков, мексиканские волки отличаются более мелкими размерами, более короткими и узкими мордами, а также более крупными ушами, что является адаптацией к жаркому климату. Филогенетические исследования демонстрируют его базальное положение среди североамериканских подвидов, что свидетельствует о ранней дивергенции от общей предковой линии.

Интенсивное истребление мексиканских волков в XX веке привело к демографическому коллапсу: к 1977 году эффективная численность популяции сократилась до 7 особей. Генетический анализ выявил критическое снижение гетерозиготности (He = 0,45) и накопление вредоносных аллелей. Коэффициент инбридинга (F) в некоторых линиях достигает 0,25, что проявляется в сниженной фертильности и повышенной смертности молодняка. Благодаря программам реинтродукции, сегодня популяции мексиканских волков насчитывают около 250 особей на территориях восточной Аризоны и западного Нью-Мехико в США, а также в горах Мексики.

2. Характеристики сборки генома Canis lupus baileyi

Сборка генома mCanLup2.hap1
Характеристика Значение
Идентификатор GenBank GCA_048164855.1
Идентификатор RefSeq GCF_048164855.1
Уровень сборки генома Chromosome
Общий размер генома 2.5 Gb
Число фрагментов генома в сборке 249
N50 для скэффолдов 65.6 Mb
L50 для скэффолдов 15
N50 для контигов 32 Mb
L50 для контигов 28

N50 — это длина самой короткой последовательности в наборе контигов/скэффолдов, покрывающие в сумме не менее 50% генома.

L50 — это минимальное количество самых длинных контигов/скэффолдов, покрывающие в сумме не менее 50% генома.

Изучаемая сборка демонстрирует хорошее качество: относительно большое значение N50 и маленькое L50 указывают на низкую фрагментированность сборки и длинные контиги.

3. Знакомство с поисковыми системами NCBI, ENA, DDBJ

Поисковая система NCBI