Банки нуклеотидный последовательностей

Описание сборки генома канадского бобра.
Название организма: Castor canadensis(Канадский бобр)
Число сборок генома: 2
Наиболее полная сборка - GCA_001984765.1
Общая длина:2,518,306,565
Число контигов:24,477
Число скэффолдов:21,157
N50:273,954
L50:2,431
Число аннотированных белков: 37422
Ссылка на публикацию
Ссылка на последовательность контига MTKA01020751 на RefSeq
Описание ключей, используемых в таблицах особенностей
Feature KeyОписаниеПример
CDSКодирующая последовательность:последовательность нуклеотидов, которой соответсвует последовательность аминокислот в белке.
/allele="text"
/artificial_location="[artificial_location_value]"
/citation=[number]
/codon_start=<1 or 2 or 3>
/db_xref=":"
/EC_number="text"
/exception="[exception_value]"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/number=unquoted text (single token)
/old_locus_tag="text" (single token)
/operon="text"
/product="text"
/protein_id=""
/pseudo
/pseudogene="TYPE"
/ribosomal_slippage
/standard_name="text"
/translation="text"
/transl_except=(pos:,aa:)
/transl_table =
/trans_splicing
CDS                  complement(join(8031..8749,9056..9104))
                     /codon_start=1
                     /transl_table=4
                     /gene="cox2"
                     /product="cytochrome c oxidase subunit 2"
                     /db_xref="GOA:A0A059XIH1"
                     /db_xref="InterPro:IPR001505"
                     /db_xref="InterPro:IPR002429"
                     /db_xref="InterPro:IPR008972"
                     /db_xref="InterPro:IPR011759"
                     /db_xref="InterPro:IPR014222"
                     /db_xref="InterPro:IPR034210"
                     /db_xref="InterPro:IPR036257"
                     /db_xref="UniProtKB/TrEMBL:A0A059XIH1"
                     /protein_id="AIA24141.1"
                     /translation="MLNMLKSLNIISPVWNYAPEPWQWTFQDGASPSFEGIVELHDQIM
                     FYLVVILFGVAWMLTSIIVNFGSNKNQIVYKYHNHGTLIELIWTITPAFVLIAIAFPSF
                     KLLYLMDEVIDPAMTIKALGHQWYWSYEYSDFVNEDGESIEFDSYLVPTDDLEDGQLRL
                     LEVDNRVVVPVGTHIRFIVTGADVIHSFAVPSLGLKIDAIPGRLNQTSVLVEREGVYYG
                     QCSEICGVHHGFMPIAVEAVSLEKYLAWLNEQA"
centromereОбласть, идентифицированная как центромера (промежуток ДНК, который соотвествует области, где хроматиды соединяются друг с другом и где формируется кинотохор.
/citation=[number]
/db_xref=":"
/experiment="[CATEGORY:]text"
/inference="[CATEGORY:]TYPE[(same species)][:EVIDENCE_BASIS]"                               
/note="text"
/standard_name="text" 
centromere           114385..114394
                     /note="CEN3_CDEI of CEN3"
intronИнтрон (часть гена, которая транскрибируется в первичную мРНК, а потом вырезается в процессе сплайсинга)
/allele="text"
/citation=[number]
/db_xref=":"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/number=unquoted text (single token)
/old_locus_tag="text" (single token)
/pseudo
/pseudogene="TYPE"
/standard_name="text"
/trans_splicing
intron              568..788
                     /gene="ubc42"
                     /number=1
ncRNAНекодирующая РНК. Область, результатом транскрипции которой является РНК, но не мРНК, не тРНК и не рибосомальная РНК.
/allele="text"
/citation=[number]
/db_xref=":"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/old_locus_tag="text" (single token)
/operon="text"
/product="text"
/pseudo
/pseudogene="TYPE"
/standard_name="text"
/trans_splicing
(взят из примеров в help)
ncRNA                /ncRNA_class="miRNA"
                     /ncRNA_class="siRNA"
                     /ncRNA_class="scRNA"
operonОперон. Область, содержащая полицистронную последовательность мРНК (кодирует аминокислотные последовательности более, чем по одной полипептидной цепи) и включающая гены, которые находятся под контролем одних и тех же регуляторных последовательностей/промоторов.
/allele="text"
/citation=[number]
/db_xref=":"
/experiment="[CATEGORY:]text"
/function="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/map="text"
/note="text"
/phenotype="text"
/pseudo
/pseudogene="TYPE"
/standard_name="text"
 operon            160..6865
                     /operon="gal"
precursor_RNAЛюбой вид незрелой РНК,может включать некодирующую РНК, рРНК, тРНК, 5' - нетраслируемую область, кодирующую последовательность(CDS, экзон), интроны, 3' - нетранслируемую область.
/allele="text"
/citation=[number]
/db_xref=":"  
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/old_locus_tag="text" (single token)
/operon="text"
/product="text"
/standard_name="text"
/trans_splicing
 precursor_RNA   28500..28706
                     /gene="MIR838"
                     /locus_tag="AT1G01046"
                     /gene_synonym="microRNA838A"
                     /gene_synonym="MIR838A"
                     /gene_synonym="p_MI0005394"
                     /product="microRNA ath-MIR838 precursor"
                     /db_xref="Araport:AT1G01046"
                     /db_xref="TAIR:AT1G01046"
propeptideПропептидная кодирующая последовательность. Кодирующая последовательность домена пропептидов,которые расщепляются с образованием зрелого белкового продукта.
/allele="text"
/citation=[number]
/db_xref=":"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/old_locus_tag="text" (single token)
/product="text"
/pseudo
/pseudogene="TYPE"
/standard_name="text"



Проект "100000 геномов людей"
Проект начался в 2012 году в Великобритании, его цель – выявление общих генетических черт, лежащих в основе ряда форм рака и редких наследственных заболеваний. Он проводится компанией Genomics England. Планируется секвенировать 100000 геномов, проект пока что не завершён. На данный момент отсеквенирован 87231 геном(по состоянию на 1.10.2018). Ссылка на проект

Описание митохондриального генома Lichtheimia hongkongensis
Поиск проводился в ENA по таксону Mucoromycota и содержал следующий текст запроса: "tax_tree(1913637) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion""
Всего было 27 находок, все 27 в Release.
Выбранный организм - Lichtheimia hongkongensis
AC: KJ561171.1
Таблица с генами белков
Расположение белков в геноме


©Кондратенко Наталья, 2017