Отчет за практикум 7

Задание 1. Выбор сборки генома эукариотического организма

Для выполения заданий практикума мной был выбран Обыкновенный песец (Arctic fox, лат. Vulpes lagopus).
Обыкновенный песе́ц, или полярная лисица — вид хищных млекопитающих семейства псовых, обычно относимый к роду лисиц (иногда выделяется в отдельный род Alopex). Это небольшое хищное животное, напоминающее лисицу. Живут в самых экстремальных условиях планеты. Они невероятно выносливы и имеют целый арсенал приспособлений, которые позволят выжить даже если температура резко опуститься до -50 градусов по Цельсию. В отличие от лисицы, тело у песца приземистое, морда укороченная; уши закруглены, слабо выступают из зимней шерсти (это предохраняет их от обморожения). Название вида — lagopus от др.-греч. λᾰγώπους «зайценогая»: подошвы лап у песцов покрыты жёсткими волосами.

Диплоидный набор содержит 48 аутосом и 2 половые хромосомы.

vulpes lagopus vulpes lagopus
Рис.1. Фотографии Vulpes lagopus

По моему поисковому запросу "Vulpes lagopus" было найдено 3 сборки. Я выбрала сборку, имеющую уровень "Chromosome". То есть сборку, имеющую последовательность для одной или нескольких хромосом (сама последовательность при этом может содержать пробелы).

Сборка является референсной. Это значит, что ее вручную выбрали в качестве стандарта как наиболее качественную по сравнению с другими данными.

Задание 2. Таблица некоторых характеристик выбранной сборки

Таблица 1. Характеристики выбранной сборки
Идентификатор GenBankGCA_018345385.1
Идентификатор RefSeqGCF_018345385.1
Общий размер генома2.3 Gb
Scaffold N50 *131.5 Mb
Scaffold L50 **8
Contig N5033.5 Mb
Contig L5024

* N50: Длина контига(или скаффолда), для которого половина всех нуклеотидов сборки содержится в контигах (скаффолдах) такой и большей длины.
** L50: Минимальное число контигов(или скаффолдов), в которых содержится половина всех нуклеотидов сборки.

Задание 3

Я скачала следующую информацию о выбранной сборке с сайта NCBI:

1. Нуклеотидные последовательности генома (в формате FASTA);
2. Последовательности белков (в формате FASTA);
3. Последовательности генома с аннотацией (GBFF).