Практикум 7

Нуклеотидные банки данных

Задание 1

Кабанчики - прикольные создания, которые очень мило хрюкают. Поэтому я решил начать поиск генома на NCBI c Suidae (pigs). Сайт нашел 31 геном, тогда я в фильтрах выставил уровнь сборки: Chromosome, а в статусе: только аннотированные геномы. После всех изменений в поисковом запросе осталось только 2 генома: Sus scrofa и Phacochoerus africanus. И я выбрал вторую, хотя обе эти сборки являются референсными, то есть высшего качества.[1]

Африканский бородавочник – дикий представитель семейства Suidae, обитающий на пастбищах, саваннах и редколесье Африканского континента к югу от Сахары. Окрас, как правило, черный или коричневый.Хвост длинный и заканчивается пучком волос. Небольшое содержание подкожного жира и редкая шерсть, делает африканских бородавочников восприимчивым к экстремальным температурам окружающей среды.[2]

Реальное количество хромосом:17 как и в выбранной сборке.

Задание 2

Идентификатор GenBank GCA_016906955.1
Идентификатор RefSeq GCF_016906955.1
Общий размер генома 2.4 млрд п.н.
Скэффолд N50 141.9 млн п.н.
Скэффолд L50 6
Контиг N50 10.6 млн п.н.
Контиг L50 71

N50 и L50 - оценки качества сборки генома. N50 определяется как самый короткий контиг (или скэффолд) при суммировании длин минимального числа контигов (или скэффолдов) для получения суммы, не меньше половины длины сборки генома.

L50 — минимальное число контигов (или скэффолдов), чья суммарная длина не менее половины суммарной длины сборки.[3]

Задание 3

Последовательно скачал:

Нуклеотидные последовательности генома (в формате FASTA);

Последовательности белков (в формате FASTA);

Последовательности генома с аннотацией (GBFF).

Ссылки:

[1] [2] [3]