Практикум 7

Нуклеотидные банки данных

Задание 1. Выбор качественной сборки генома эукариотического организма

Я искала сборку генома большой панды - Ailuropoda melanoleuca (giant panda). Бамбуковый медведь - вид всеядных млекопитающих из семейства медвежьих, они имеют черно-белую окраску и обладают признаками енота. Когда-то их называли пятнистым медведем. У большой панды 42 хромосомы.

picture
Рис.1. Большая панда

На сайте NCBI в поисковую строку был введен запрос: Ailuropoda melanoleuca (giant panda). По нему было найдено 3 сборки.

picture
Рис.2. Результат поиска

Я выбрала первую сборку (Genome assembly ASM200744v3), уровень этой сборки - Chromosome. Это означает, что имеется последовательность для одной или нескольких хромосом. Это может быть полностью секвенированная хромосома без пробелов или хромосома, содержащая скаффолды или контиги с пробелами между ними. Также могут присутствовать неразмещенные или нелокализованные скаффолды. Выбранная мной сборка является референсной (референсный геном - отобранная вручную высококачественная сборка генома, которую NCBI и эксперты определили, как важную в качестве стандарта, с которым сравниваются другие данные)

Задание 2. Таблица с некоторыми характеристиками

Таблица 1. Некоторые характеристики выбранной сборки

Assembly Genome size Number of chromosomes Number of scaffolds Scaffold N50 Scaffold L50 Number of contigs Contig N50 Contig L50 Assembly level
GenBank GCA_002007445.3 2.4 Gb 21 73,513 129.2 Mb 8 122,819 127.7 kb 5,332 Chromosome
RefSeq GCF_002007445.2 2.4 Gb 21 73,513 129.2 Mb 8 122,819 127.7 kb 5,332 Chromosome

Параметр N50 обозначает длину контига, для которого 50% всех нуклеотидов сборки в контигах такий и большей длины. Параметр L50 обозначает наименьшее число контигов, в которых содержится 50% всех нуклеотидов данной сборки

Задание 3. Сборка генома, аннотация и предсказанные белковые последовательности выбранного организма

C сайта NCBI были скачаны файлы со сборкой генома, последовательностью генома с аннотацией и последовательностью белков