7. Нуклеотидные банки данных


1. Выбор сборки генома эукариотического организма

Я искала геном речной выдры (лат. Lutra lutra). Этот организм относится к семейству куньих. У них 20 пар хромосом, включая две половые (ΧΧ или XY).

otter
Рис. 1 Выдра сидящая

Искала по запросу "Lutra lutra (Europeran otter)", сборок нашлось две. У выбранной сборки mLutLut1.2 качество уровня chromosome. Это значит, что есть последовательность для одной или нескольких хромосом данного организма. Эти хромосомы могут быть полностью секвенированы, не содержать пропусков или иметь скаффолды, контиги с пропусками между ними. Могут быть и нелокализованные скаффолды.

2. Некоторые характеристики выбранной сборки


Таблица характеристик выбранной сборки
Идентификатор GenBank GCA_902655055.2
Идентификатор RefSeq GCF_902655055.1
Общий размер генома (п.н.) 2.4 Gb
Число хромосом 20
Число скэффолдов 43
Число контигов 228
Scaffold N50 149 Mb
Scaffold L50 7
Contig N50 30.4 Mb
Contig L50 23

Contig N50 - длина контига, для которого 50% всех нуклеотидов сборки содержится в контигах такой и большей длины.

Contig L50 - наименьшее число контигов, в которых содержится 50% всех нуклеотидов сборки.

Для Scaffold аналогично.

Данная сборка отражает биологическую информацию о геноме выбранного организма хорошо.


3. Скачивание сборки генома, аннотации и предсказанных белковых последовательностей

Скачала соответсвующие файлы через NCBI FTP: