Банки нуклеотидных последовательностей

Сборка генома дикой капусты, Brassica oleracea var. oleracea

Капуста дикая
Brassica oleracea var. oleracea. By Kulac - Self-published work by Kulac, CC BY-SA 3.0, Link
Таблица 1. Данные сборок
Свойство Значение
Всего сборок 3
Описывается сборка BOL, RefSeq accession GCF_000695525.1
Общая длинна 488,954,160
Контигов 83 956
Скэффолдов 32 886
N50 (скэффолды, контиги) 48 366 697; 21 938
L50 (скэффолды, контиги) 5; 5 920
Аннотированных белков (CDS with protein) 56610
Ссылка на контиг JJMF01000001.1
Статьи, связанные с проектом Genome dominance, mitochondrial genome

Ключи особенностей

Таблица 2. Ключи особенностей
Ключ Описание Пример
5'UTR Участок на 5' конце зрелого транскрипта или вирусного генома (не транслируется в белок).
5'UTR           1..48
                /gene="5'UTR"
                /locus_tag="NZ87_gp1"
			    
oriT Участок, с которого начинается трансфер молекулы ДНК при конъюгации или мобилизации.
oriT            6582..6669
                /gene="oriT"
                /note="oriT of RSF1010 plasmid"
			    
repeat_region Участок генома с повторяющимися последовательностями.
repeat_region   1785..1812
                /locus_tag="pT15G-1_2"
                /note="terminal inverted repeat"
                /rpt_type=inverted
                /rpt_type=terminal
			    
sig_peptide Кодирующий участок сигнальной последовательности, домена на N конце белка.
sig_peptide     join(427..481,608..618)
                /gene="IGK"
			    
telomere Теломеры.
telomere        complement(1..7223)
                /note="TEL16L; Telomeric region on the left arm of
                Chromosome XVI; annotated components include an X element
                core sequence, X element combinatorial repeats, and a long
                Y' element; TEL16L does have telomeric repeats
                (TEL16L-TR), but they are missing from the genome
                annotation due to difficulties encountered during
                sequencing and/or assembly"
                /db_xref="SGD:S000028933"
			    
mat_peptide Кодирующая последовательность зрелого белка/пептида. Не включает стоп кодон.
mat_peptide     619..903
                /gene="IGK"
                /pseudo
			    
iDNA ДНК, которая вырезается путем рекомбинации.
iDNA            903..>2350
                /gene="IGK"
                /note="V-J intervening DNA"
			    

Геномный проект "100K Pathogen Genome Project"

Цель проекта — создать базу данных драфтов геномов разных патогенных микроорганизмов, лишь небольшое число геномов планируется довести до референсного состояния. Начат в 2012 Бартом Веймером (UC Davis, Weimer MicroLab). У проекта имеется свой сайт. На данный момент по данным сайта секвенировано 35000 геномов

Последняя публикация в PubMed: Draft Genome Sequences of Salmonella enterica Serovar Typhimurium LT2 with Deleted Chitinases That Are Emerging Virulence Factors.

Таблица митохондриальных генов

Таблица 3. Опимание митохондриального генома
  Значение
Текст запроса tax_tree(10197) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Release 8
Update 0
Организм Mnemiopsis leidyi
AC записи JF760210
Таблица генов белков CSV

© Бушмакин Илья, 2017