Банки seq'ов

Банки нуклеотидных последовательностей

Характеристика качества сборки генома эукариотического организма


Таблица 1. Характеристики организма

Название вида (русское) Девятипоясный броненосец
Название вида (латинское) Dasypus novemcinctus
Число сборок генома (использованная) 2 (GCA_000208655.2)
Общая длина 3,631,522,711
Число контигов 314,972
Число скэффолдов сборки 46,559
Scaffold N50 1,687,935
Scaffold L50 568
Contig N50 26,277
Contig L50 37,255
Число аннотированных белков 38,178
Ссылка на публикацию с описанием проекта
Ссылка на последовательность 33-го контига

Таблица 2. Ключи таблиц особенностей

Feature Key

Definition

Example

gene region of biological interest identified as a gene and for which a name has been assigned <1..1050
/gene="ATH1"
source identifies the biological source of the specified span of the sequence; this key is mandatory; more than one source key per sequence is allowed; every entry/record will have, as a minimum, either a single source key spanning the entire sequence or multiple source keys, which together, span the entire sequence 1..7000
/organism="Saccharomyces cerevisiae"
/strain="S288C"
/chromosome="XVI"
mRNA messenger RNA; includes 5'untranslated region (5'UTR), coding sequences (CDS, exon) and 3'untranslated region (3'UTR) <1..1050
/gene="ATH1"
/product="acid trehalase"
CDS coding sequence; sequence of nucleotides that corresponds with the sequence of amino acids in a protein (location includes stop codon); feature includes amino acid conceptual translation <1..1009
/gene="ATH1"
/note="Ath1p"
/codon_start=2
/product="acid trehalase"
/translation="DHNGTIVHKSGDVPIHIKIPNRSLIHDQDINFYNGSENERKPNL
ERRDVDRVGDPMRMDRYGTYYLLKPKQELTVQLFKPGLNARNNIAENKQITNLTAGVP
GDVAFSALDGNNYTHWQPLDKIHRAKLLIDLGEYNEKEITKGMILWGQRPAKNISISI
LPHSEKVENLFANVTEIMQNSGNDQLLNETIGQLLDNAGIPVENVIDFDGIEQEDDES
LDDVQALLHWKKEDLAKLIEQIPRLNFLKRKFVKILDNVPVSPSEPYYEASRNQSLIE
ILPSNRTTFTIDYDKLQVGDKGNTDWRKTRYIVVAVQGVYDDYDDDNKGATIKEIVLN
D"
exon region of genome that codes for portion of spliced mRNA, rRNA and tRNA; may contain 5'UTR, all CDSs and 3' UTR complement(4535..4570)
/number=1
tRNA mature transfer RNA, a small RNA molecule (75-85 bases long) that mediates the translation of a nucleic acid sequence into an amino acid sequence complement(join(4535..4570,4590..4626))
/product="tRNA-Phe"
assembly_gap gap between two components of a genome or transcriptome assembly 2939417..3289416
/estimated_length=350000
/gap_type="between scaffolds"

Таблица 3. Описание проекта

Название проекта 100,000 Genomes Project
Цель Упорядочивание геномов людей с записью их истории болезней, с целью быстрой диагностики заболеваний
Год начала работ 2012
Организация Government of the United Kingdom
Страна Великобритания
Планируемое число геномов 100,000
Планируемый год завершения По завершении запланированных работ (неизвестно)
Количество секвенированных геномов на 2018 год 87,231
Страница проекта
Последняя публикация

Таблица 4. Митохондриальные гены

Банк ENA
Запрос tax_tree(1913637) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Число находок в Release/Update 27/0
Название по латыни / по-русски Rhizopus oryzae / Ризопус рисовый
AC AY863212.1
Таблица с генами белком


Полезные ссылки:

Главная страница;

Профайл;

Учебные реалии, или список семестров;

Официальный сайт ФББ МГУ.


© Daniel Igumnov, 2018