Задание 1.

Для практикума я выбрала - Дикий кабан (Sus scrofa).

Дикий кабан — это крупное и сильное животное, обитающее в лесах и на открытых пространствах Европы, Азии и Северной Америки. Он обладает мощными клыками, которые использует в борьбе за территорию и защиту от угроз. Кабан — ночной зверь, предпочитающий скрываться днем в зарослях, а ночью активно искать пищу. Несмотря на свою массивность, он способен развивать скорость до 50 км/ч, что помогает ему быстро убегать от хищников. Кабаны играют важную роль в экосистемах, копая землю и способствуя распространению семян различных растений. У кабана 36 хромосом (гаплоидный набор).

Рис. 1. Кабанчик гуляет на природе. Изобравение взято с сайта.

По поисковому запросу "Sus scrofa" была найдена 41 сборока, была выбрана референсная (Sscrofa11.1) c аннотацией в RefSeq. Уровень сборки chromosome, что означает, что последовательность ДНК организма была собрана и упорядочена таким образом, что её можно представить на уровне отдельных хромосом (одной или нескольких).

Задание 2.

Таблица 1. Характеристики выбранной сборки.
Assembly GenBank RefSeq Genome size Number of scaffolds Number of contigs Scaffold N50 Scaffold L50 Contig N50 Contig L50
Sus scrofa GCA_000003025.6

GCF_000003025.6
2.5 Gb

705

1,117

88.2 Mb

9

48.2 Mb

15

* N50 — это длина самого короткого контига, для которого половина (50%) всех нуклеотидов сборки содержится в контигах такой и большей длины

* L50 — это число контигов (наименьшее), в которых содержится половина (50%) всех нуклеотидов сборки

Рис. 2. Анализ BUSCO (источник).

BUSCO показало очень высокое качество сборки.

Задание 3.

Скачала следующие файлы:

GCF_000003025.6_Sscrofa11.1_protein.faa – последовательности белков в формате FASTA;

GCF_000003025.6_Sscrofa11.1_genomic.fna – нуклеотидные последовательности генома в формате FASTA;

GCF_000003025.6_Sscrofa11.1_genomic.gbff – последовательности генома с аннотацией.