К сожалению, изображение недоступно

Нуклеотидные банки данных

Для характеристики качества сборки генома эукариотического организма я выбрала серую крысу (Rattus norvegicus).

В базе данных NCBI содержится 7 сборок. Я выбрала самую полную сборку (GCA_000001895.4). Число проектов по секвенированию организма: 2 (PRJNA12455 и PRJNA10629); и число образцов: 1. В этой сборке был использован образец SAMN02808228; GenBank: Rnor_6.0, который является сочетанием двух отдельных образцов SAMN02808218 и SAMN02808227. Rnor_6.0 включает самок штамма BN/SsNHsdMCW и одного самца штамма SHR (также известного как SHR-Akr). Первый проект называется PRJNA10629. Проект осуществляется с помощью RGSC. Стратегия проекта представляет из себя гибрид подхода WGS подхода, используемого для генома мыши, и иерархического (BAC clone) подхода, используемого для генома человека. Второй проект называется PRJNA12455. Проект осуществляется с помощью RGSC. Собраный геном распространяется международно с помощью FTP. Собранный геном аннотирован на NCBI.

  • Число скэффолдов сборки: 1395.
  • Cкэффолд N50: 100461.
  • Cкэффолд L50: 7356.
  • Число контигов сборки: 73554.
  • Континг N50: 100461.
  • Континг L50: 7356.
  • Таблица контигов: AABR07.xlsx.
  • Последовательность контига AABR07000001: AABR07000001.fasta.
  • Самый короткий контиг (длина: 53) : ABR07003018.
  • Самый длинный контиг (длина: 932675) : AABR07003260.

Таблицу митохондриальных генов я составляла для мха Hypnum imponens (рис.1).

К сожалению, изображение недоступно

Рис.1 Hypnum imponens.

Для поиска по полям в БД Nucleotide (NCBI) я использовала запрос: gene_in_mitochondrion[PROP] AND "Hypnum imponens"[Orgn]. Список полей в NCBI: help. Из записи с последовательностью генома я перешла на страницу описания генома по ссылке Genome в разделе Related information. Тут (рис.2) я нашла число генов РНК (27) и белков (40).

К сожалению, изображение недоступно

Рис.2 Replicon info.

Список всех генов, отсортированный по началу в геноме, я получила по ссылке Gene в разделе Related information, для загрузки использовала ссылку "send to": gene_result.xlsx. Опиcание десяти ключей, используемых в таблицах особенностей, представлено в таблице 1. Информацию я нашла на сайте INSDC.

Таблица 1. Ключи, используемых в таблицах особенностей.
Ключ Описание Пример
promoter Область молекулы ДНК, узнаваемая РНК-полимеразой для связывания и инициации транскрипции 1..9
/gene="ubc42"
RBS Сайт связывания рибосомы 95..100
/gene="sod"
CDS Белок-кодирующая последовательность 803..1344
/gene="traN"
/product="transfer protein N"
rep_origin Ориджин репликации 6
/direction=LEFT
/note="ori"
tRNA Транспортная РНК 655..730
/gene="tRNA-Leu(UUR)"
/anticodon=(pos:678..680,aa:Leu,seq:taa)
/product="transfer RNA-Leu(UUR)"
terminator Последовательность ДНК, которая вызывает остановку РНК-полимеразы при транскрипции 723..746
/gene="sod"
source Идентифицирует биологический источник указанного промежутка последовательности 1..756
/db_xref="taxon:1638"
/organism="Listeria ivanovii"
/strain="ATCC 19119"
/mol_type="genomic DNA"
gene Область биологического интереса, идентифицируемая как ген, для которой было назначено имя 212..8668
/gene="NF1"
mRNA Матричная РНК 189..6865
/operon="gal"
V_region Вариабельная область иммуноглобулина легкой и тяжелой цепи 1..277
/gene="VFM1"
/product="immunoglobulin heavy chain variable region"


© Князева Анастасия, 2015