Для практикума я выбрала - Дикий кабан (Sus scrofa).
Дикий кабан — это крупное и сильное животное, обитающее в лесах и на открытых пространствах Европы, Азии и Северной Америки. Он обладает мощными клыками, которые использует в борьбе за территорию и защиту от угроз. Кабан — ночной зверь, предпочитающий скрываться днем в зарослях, а ночью активно искать пищу. Несмотря на свою массивность, он способен развивать скорость до 50 км/ч, что помогает ему быстро убегать от хищников. Кабаны играют важную роль в экосистемах, копая землю и способствуя распространению семян различных растений. У кабана 36 хромосом (гаплоидный набор).
Рис. 1. Кабанчик гуляет на природе. Изобравение взято с сайта.
По поисковому запросу "Sus scrofa" была найдена 41 сборока, была выбрана референсная (Sscrofa11.1) c аннотацией в RefSeq. Уровень сборки chromosome, что означает, что последовательность ДНК организма была собрана и упорядочена таким образом, что её можно представить на уровне отдельных хромосом (одной или нескольких).
Assembly | GenBank | RefSeq | Genome size | Number of scaffolds | Number of contigs | Scaffold N50 | Scaffold L50 | Contig N50 | Contig L50 |
---|---|---|---|---|---|---|---|---|---|
Sus scrofa | GCA_000003025.6 |
GCF_000003025.6 |
2.5 Gb |
705 |
1,117 |
88.2 Mb |
9 |
48.2 Mb |
15 |
* N50 — это длина самого короткого контига, для которого половина (50%) всех нуклеотидов сборки содержится в контигах такой и большей длины
* L50 — это число контигов (наименьшее), в которых содержится половина (50%) всех нуклеотидов сборки
Рис. 2. Анализ BUSCO (источник).
BUSCO показало очень высокое качество сборки.
Скачала следующие файлы:
GCF_000003025.6_Sscrofa11.1_protein.faa – последовательности белков в формате FASTA;
GCF_000003025.6_Sscrofa11.1_genomic.fna – нуклеотидные последовательности генома в формате FASTA;
GCF_000003025.6_Sscrofa11.1_genomic.gbff – последовательности генома с аннотацией.