Нуклеотидные банки данных

Выбор качественной сборки генома

В качестве объекта была выбрана актиния Nematostella vectensis (starlet sea anemone), это небольшая (от 2 до 6 см) актиния, обитающая на побережьях Северной Америки и Англии. Способна существовать в большом диапазоне температур и солёности. Является неплохим модельным объектом в изучении эволюции книдарий, эмбриогенеза и регенерации.[1]

При запросе "Actiniaria (sea anemones)" в NCBI было найдено 23 геномных сборок. Была выбрана геномная сборка, принадлежащая вышеупомянутому организму и отвечающая необходимым требованиям:

1. Имеет аннотированные гены

2. Является референсной - это значит, что она высокого качества и определена как стандарт, с которым сравниваются другие сборки в кладе.

hormiphora
Nematostella vectensis
3. Качество сборки - хромосомная, то есть получена последовательность одной или нескольких хромосом организма (хромосома может быть полностью секвенированна или на уровне скэффолдов и контигов с гэпами).

Характеристика выбранной сборки

Далее представлены основные параметры сборки:

Идентификатор GenBank GCA_932526225.1
Идентификатор RefSeq GCF_932526225.1
Общий размер генома 269.4 Mb
Scaffold N50 17.9 Mb
Scaffold L50 7
Conting N50 2.9 Mb
Conting L50 25
Таблица 1

.

N50 - максимальная длина континга, такая, что сумма длин больших или равных контигов равна половине размера генома.

L50 - минимальное количество контигов, сумма длин которых равна половине размера генома.

Скачивание необходимых файлов

Далее через NCBI FTP были скачаны необходимые файлы:

1. Нуклеотидная последовательность генома (GCF_932526225.1_jaNemVect1.1_genomic.fna.gz)
2. Последовательность белков (GCF_932526225.1_jaNemVect1.1_protein.faa.gz)
3. Последовательность генома с аннотацией (GCF_932526225.1_jaNemVect1.1_genomic.gbff.gz)

Источники

1. Al-Shaer, Layla & Havrilak, Jamie & Layden, Michael. (2021). Nematostella vectensis as a Model System. 10.1201/9781003217503-7.