Практикум 7. Нуклеотидные банки

1. Задание 1

Я остановила свой выбор на удивительном зверьке семейства гекконы - леопардовом эублефаре (лат. Eublepharis macularius). Это животное привлекло мое внимание, потому что строение челюсти эублефара устроено таким образом, что складывается ощущение, что он постоянно улыбается) Ну и кроме того, эта рептилия живет у меня дома 😊

Рис.1. Улыбающийся Eublepharis macularius Жожоба во время работы. Фото сделано автором.

Поисковый запрос: По запросу Eublepharis macularius в NCBI обнаружена только 1 сбоорка, она же был выбрана.

Сборка: Сборка является референсной, т.е. эта сборка генома обработана вручную и определена, как качественная. Данный вид имеет 19 пар хромосом, в сборке было найдено столько же.

Уровень сборки: Уровень сборки генома Chromosome (хромосомный уровень) , что означает, что последовательность ДНК организма была собрана и упорядочена таким образом, что её можно представить на уровне отдельных хромосом.

Задание 2

Таблица 1. Характеристики выбранной сборки
Идентификатор GenBank Идентификатор RefSeq Общий размер генома N50 скэффолдов L50 скэффолдов N50 контигов L50 контигов
GCA_028583425.1 GCF_028583425.1 2.2 Gb 145.6 Mb 6 80.1 Mb 9

Комментарии:

Contig N50 (145.6 Mb): это длина самого короткого контига, из контигов (минимального числа), где общая сумма длин составляет 50% от общего числа нуклеотидов в сборке

Contig L50 (9): наименьшее число контигов, в которых содержится 50% всех нуклеотидов сборки (общая длина хотя 50%) Аналогично для Scaffold

1. Задание 3

Файлы:

GCF_028583425.1_MPM_Emac_v1.0_genomic.fna - Нуклеотидные последовательности генома (в формате FASTA)

protein.faa - Последовательности белков (в формате FASTA)

genomic.gbff - Последовательности генома с аннотацией (GBFF)