Практикум 7

Выбор качественной сборки генома эукариотического организма

Я выбрала вид из семейства кошачьих(Felidae) - кошку Жоффруа (лат. Leopardus geoffroyi или Oncifelis geoffroyi)

По размеру соотносима с домашними кошками, однако по окрасу практически полностью повторяет рисунок леопарда. Обитает в южной части Северной Америки, ареал простирается от Боливии до Патагонии. Из-за качественного меха и необычной окраски были практически истреблены браконьерами, но на данный момент вид находится под охраной Вашингтонской конвенции по защите природы и перешел из особо охраняемых видов в "вызывающие наименьшие опасения".[1]

Рис.Фото Leopardus geoffroyi

Изначально я просто искала кого-то из семейства кошачьих с уровнем сборки Chromosome и выше, после чего выбрала из понравившихся. Однако введя Leopardus geoffroyi я получила только одну сборку. Стоит также отметить что при поиске можно найти метиса домашней кошки и Leopardus geoffroyi, что интересно из-за того что потомство от такого союза будет бесплодным в виду различия хромосомных наборов.

У Жоффруа 36 пар хромосом, но в сборке представлено только 18 штук.

У сборки GCA_018350155.1 уровень Chromosome, что означает что это последовательностей хромосом. Также она является референсной, то есть выбрана как лучшая среди других.

Характеристики выбранной сборки


Характеристики выбранной сборки
Идентификатор GenBank GCA_018350155.1
Идентификатор RefSeq GCF_018350155.1
Общий размер генома 2.4 Gb
Scaffold N50 152.6 Mb
Scaffold L50 7
Contig N50 104.5 Mb
Contig N50 9

N50 - длина контига/скэффолда для которого половина от всех контигов/скэффолдов такой же или большей длины.

L50 - минимальное количество кончиков/скэффолдов в которых находится половина нуклеотидов сборки.

Загрузка файлов

Через NCBI FTP было загружено три файла

  • Нуклеотидные последовательности генома (в формате FASTA)
  • Последовательности белков (в формате FASTA)
  • Последовательности генома с аннотацией (GBFF)