Нуклеотидные базы данных

Выбор сборки генома эукариотического организма

В данном практикуме я выбрала для описания геном Домашней лошади - Equus ferus. Данный вид с древности сопровождает человека. В свою очередь человек использует данных животных в самых различных отраслях жизни: домашнее хозйяство, грузоперевозка, досуг, рекреация. Удивительным явяляется то, что сейчас среди организмов данного вида выведено около 200 различных пород. Пример внешнего вида организма представлен на рисункe.

loshadka

Организм имеет 64 хромосомы в диплоидном наборе.

Выбранная сборка EquCab3.0 была найдена по запросу Equus caballus. По нему было найдено 16 различных записей. Среди прочих она была выбрана так как отмечена референсной и отвечала всем требованиям для описания. Уровень сборки - Chromosome, это означает, что сборка содержит полный набор последовательностей отдельных хромосом.

Характеристики сборки

Характеристика Значение
Идентификатор GenBank GCA_002863925.1
Идентификатор RefSeq GCF_002863925.1
Общий размер генома (п.н.) 2.5 Gb
Число фрагментов генома в сборке 4,700
N50 для контигов 1.5 Mb
L50 для контигов 462
N50 для скаффолдов 87.2 Mb
L50 для скаффолдов 12

Пояснения: N50 - длинна контига, для которого половина всех нуклеотидов в сборке сожержится в контигах такой и большей длины.
L50 - наименьшее число контигов, в которых содержится половина всех нуклеотидов сборки.

Скачивание сборки

Файл Описание содержимого
GCF_002863925.1_EquCab3.0_genomic.fna В формате fasta указаны как полные последовательности хромосом, так и отедльные прочтения. Примечательно, что в отдельных прочтениях часто присуствуют неопредленные нуклеотиды, обозначенные NNN.
GCF_002863925.1_EquCab3.0_protein.faa В формате fasta указаны последовтельности белков, в строке аннотации указаны их названия.
GCF_002863925.1_EquCab3.0_genomic.gbff Указаны mRNA и соответсвующие SDS, их аннотация, которая включает в том числе координаты описываемых поселдовательностей.

Как мнe кажется, выбранная сборака генома обладает высоким качеством. На это указывает наличие картированных хромосом и обозначенное на странице записи высокий показатель Quality analysis.