Практикум 7. Работа с нуклеотидными базами данных

Сборка генома Ciona intestinalis

Асцидия Ciona intestinalis является предствителем класса Асцидии подтипа Оболочники. Организмы данного класса интересны тем, что, согласно современным эволюционным представлениям, оболочники являются ближайшими родственниками позвоночных животных.

Геном (состоит из 14 хромосом, гаплоидный) Ciona intestinalis был расшифрован в 2002 году и было обнаружено, что он содержит практически полный набор генов, характерных для позвоночных. Сейчас Ciona intestinalis является модельным организмом биологии развития и эволюционной геномики.

Поисковый запрос в системе поиска на сайте NCBI Datasets выглядел следующим образом Ciona intestinalis (yellow sea squirt)

Было найдено 5 сборок, только одна из которых была референсной и имела Хромосомный уровень сборки. (GCA_000224145.2)

Идентификатор GenBank GCA_000224145.2
Идентификатор RefSeq GCF_000224145.3
Общий размер генома 115.2 Mb
Число хромосом 14
Число органелл 1
Число скэффолдов 1,279
(N50, L50) скэффолдов (3.1 Mb, 12)
Число контигов 6,380
(N50, L50) контигов (37.1 kb, 875)

Число хромосом в сборке (14 штук, гаплоидный набор) соответствует литературным данным [PMID 15930823] о Ciona intestinalis . Так же органим является животным, поэтому наличие дополнительного фрагмента митохонриальной ДНК хорошо согласуется с систематикой организма. Сборка хорошего качества и описывает биологические особенности организма.

Файлы с информацией о сборке

  • Нуклеотидные последовательности генома (в формате FASTA) - файл содержит нуклеотидные последовательности всех хромосом в формате FASTA.
  • Последовательности белков (в формате FASTA) - файл содержит последовательности всех белков в формате FASTA.
  • Последовательности генома с аннотацией (GBFF) - шапка файла содержит уникальный идентификатор, информацию об организме. Основу файла составляет аннотация участков генома (координаты генов, мРНК, CDS (белок кодирующий участокв), тРНК, рРНК и других последоавтельностей. Для CDS указывается название белка и аминокислотная последоавтельность). Также в файле предоставляется нуклеотидная последовательнось для хромосом от 5' к 3' концу.