Нуклеиновые банки данных

Задание 1. Выбор сборки

Мной был выбран эукариотичесикй организм Apodemus sylvaticus - европейская мышь.

Данная сборка имеет хорошо аннотированные гены и по вермии REfSeq и по GenBank. Качество сборки находится на увроне Chromosome(то есть скаффолды, последовательности составленные из контигов, совпадает с хромосомой, а не просто нуклеотидным фрагментом). По запросу Apodemus sylvaticus мне выдало 3 результата, я выбрала с лучшей сборкой, аннотацией, репрезентативную.

Apodemus sylvaticus

Apodemus sylvaticus - европейская/обыкновенная/лесная мышь. ПРинадлежит ссемейству мышиных. Характерно робкое поведение. Распространена в Ростовской, Курской. Белгородской областях. Масса 20-30г, длина тела 8-10 см и примерно такой же хвост. 48 акроцентрических хромосом(диплоидный набор). В сборке найдено 25 хромосом.

Это референсный геном, то есть это геном наиболее показательного организма(организма с наиболее характерным для данного вида набором белков).

Задание 2. Таблица характеристик сборки

Идентификатор GenBank Идентификатор REfSeq Общий размер генома N50 L50
GCA_947179515.1 GCF_947179515.1 2,6 Gb 4,4 Mb 199

N50 - это такая длина контига, из которой можно получить 50% от всей сборки с помощью контигов такой же или больше длины.

L59 - наименьшее число контигов, которое содержится в 50% сборки.

Задание 3. Сборка генома, аннтоция и предсказанные белковые последовательности Apodemus sylvaticus

Были скачаны следующие файлы:

Из NCBI FTP