Банки нуклеотидных последовательностей

Задание 1.Сборка генома эукариотического организма


Название: Гелада(Theropithecus gelada)
Graph
Число сборок генома:1
Информация о сборке Tgel_1.0
Общая длина2 889 630 685
Число контигов сборки35 108
Число скэффолдов сборки15 308
N50 130 230 028
L509
Число аннотированных белков52 620
Публикация с описанием"PRJNA470999
Последовательность контига QGDE01000027.1QGDE01000027.1

Задание 2.Описание семи ключей


Название Описание Пример
CDS Кодирующая последовательность; последовательность нуклетиодов, которой соответствует последовательность аминокислот в белке
Optional qualifiers /allele="text"
/artificial_location="[artificial_location_value]"
/citation=[number]
/codon_start=<1 or 2 or 3>
/db_xref="<database>:<identifier>"
/EC_number="text"
/exception="[exception_value]"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/number=unquoted text (single token)
/old_locus_tag="text" (single token)
/operon="text"
/product="text"
/protein_id="<identifier>"
/pseudo
/pseudogene="TYPE"
/ribosomal_slippage
/standard_name="text"
/translation="text"
/transl_except=(pos:<base_range>,aa:<amino_acid>)
/transl_table =<integer>
/trans_splicing
https://www.ncbi.nlm.nih.gov/nuccore/1262331
CDS 896..1711
/gene="cds"
/EC_number="2.7.7.41"
/experiment="experimental evidence, no additional details
recorded"
/codon_start=1
/transl_table=11
/product="CDP-diglyceride synthetase"
/protein_id="BAA09437.1"
/translation="MLKQRIITALVLLPIALGGFFLLEGAFFALFIGAVVSLGAWEWA
RLAGYEQQFGRVAYAATVAVLMVALYHLPQLAGAVLLLALVWWTLATVLVLTYPESVG
YWGGRWRRLGMGLLILLPAWQGLVLLKQVAAANGLIIAVMVLVWGADIGAYFSGKAFG
KRKLAPRVSPGKSWEGVYGGLAASLAITLAVGLYRGWSLGALLLALLGAALVVFVSIV
GDLTESMFKRQSGIKDSSNLLPGHGGVLDRIDSLTAAIPVFAALLWAAGWGAP"
exon область генома, которая кодирует часть мРНК, подвереженной сплайсингу, рРНК и тРНК
Optional qualifiers /allele="text"
/citation=[number]
/db_xref="<database>:<identifier>"
/EC_number="text"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/number=unquoted text (single token)
/old_locus_tag="text" (single token)
/product="text"
/pseudo
/pseudogene="TYPE"
/standard_name="text"
/trans_splicing
https://www.ncbi.nlm.nih.gov/nuccore/NM_001105592.2
exon 1..111
/gene="her15.2"
/gene_synonym="her15b; hes5-like"
/inference="alignment:Splign:2.1.0"
gap Разрыв в последовательности Mandatory qualifiers /estimated_length=unknown or <integer>

Optional qualifiers /experiment="[CATEGORY:]text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/map="text"
/note="text"
https://www.ncbi.nlm.nih.gov/nuccore/LC097144.1
gap 69..2635
/estimated_length=2567
centromere Участок, идентифицированный, как центромер Optional qualifiers /citation=[number]
/db_xref="<database>:<identifier>"
/experiment="[CATEGORY:]text"
/inference="[CATEGORY:]TYPE[(same species)][:EVIDENCE_BASIS]"
/note="text"
/standard_name="text"
https://www.ncbi.nlm.nih.gov/nuccore/MG708500.1
centromere <1..>305
old_sequence Представленная последовательность представляет собой предыдущую версию последвательности в этом месте
Mandatory qualifiers /citation=[number]
Or
/compare=[accession-number.sequence-version]

Optional qualifiers /allele="text"
/db_xref="<database>:<identifier>"
/experiment="[CATEGORY:]text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/old_locus_tag="text" (single token)
/replace="text"
https://www.ncbi.nlm.nih.gov/nuccore/NC_004009.2
old_sequence 416
/locus_tag="CrvsRgp1"
/citation=[1]
/replace="a"
primer_bind Нековалентный сайт связывания праймера для инициации репликации, транскрипции или трансляции
Optional qualifiers /allele="text"
/citation=[number]
/db_xref="<database>:<identifier>"
/experiment="[CATEGORY:]text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/old_locus_tag="text" (single token)
/standard_name="text"
/PCR_conditions="text"
https://www.ncbi.nlm.nih.gov/nuccore/MH588400.1
primer_bind 1..20
regulatory Любой участок последовательности, участвующий в транскрипции, трансляции, репликации или в структуре хроматина
Optional qualifiers /allele="text"
/bound_moiety="text"
/citation=[number]
/db_xref="<database>:<identifier>"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/old_locus_tag="text" (single token)
/operon="text"
/phenotype="text"
/pseudo
/pseudogene="TYPE"
/standard_name="text"
https://www.ncbi.nlm.nih.gov/nuccore/NZ_RBIB01000009.1
regulatory 328322..328467
/regulatory_class="riboswitch"
/inference="COORDINATES: nucleotide
motif:Rfam:12.0:RF00055"
/inference="COORDINATES: profile:INFERNAL:1.1.1"
/note="molybdenum cofactor riboswitch; Derived by
automated computational analysis using gene prediction
method: cmsearch."
/bound_moiety="flavin mononucleotide"
/db_xref="RFAM:RF00055"
repeat_region Участок генома, содержащий повторяющиеся элементы
Optional qualifiers /allele="text"
/citation=[number]
/db_xref="<database>:<identifier>"
/experiment="[CATEGORY:]text"
/function="text"
/gene="text"
/gene_synonym="text"
/inference="[CATEGORY:]TYPE[ (same species)][:EVIDENCE_BASIS]"
/locus_tag="text" (single token)
/map="text"
/note="text"
/old_locus_tag="text" (single token)
/rpt_family="text"
/rpt_type=<repeat_type>
/rpt_unit_range=<base_range>
/rpt_unit_seq="text"
/satellite="<satellite_type>[:<class>][ <identifier>]"
/standard_name="text"
https://www.ncbi.nlm.nih.gov/nuccore/NZ_RAAT01000180.1
repeat_region 36620..37188
/inference="COORDINATES: alignment:crt:1.2"
/inference="COORDINATES: alignment:pilercr:v1.02"
/rpt_family="CRISPR"
/rpt_type=direct
/rpt_unit_range=36620..36647
/rpt_unit_seq="tttcttagctgcctatacggcagtgaac"

Задание 3.Геномный проект


The 100000 Genomes Project


Проект ставит целью секвенирование 100000 геномов людей с редкими заболеваниями, а также членов их семей и
пациентов, больных раком.
 
Год начала2012
Организация Department of Health & Social Care
СтранаUK
Год завершения-
Количество секвенированных геномов87 231
Страница проекта
Ссылка на публикацию PubMed

Задание 4.Таблица митохондриальных генов Stramenopiles.

 
Текст запроса(в ENA)tax_tree(33634) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Release164
Update0
Выбранный организмЛаминария пальчаторассеченная(Laminaria digitata)
ACAJ344328
Graph
Таблица генов
Ссылка на запись в ENA

© Simon Konnov 2018