Опишем сборку генома Picoides pubescens, пушистого дятла (сборка GCA_000699005.1 в NCBI). Это единственная сборка генома этого организма. Сборка относится к проектам PRJNA212874 и PRJNA263502 (в рамках первого выполнено помещение сборки в NCBI, в рамках второго — перенос сборки в RefSeq). В проектах использовался только образец SAMN02314405 (самка, поймана в США).
Для сборки N50 равен 24809 (при средней длине гена порядка 1000 нуклеотидов такое значение N50 представляется достаточно хорошим), L50 — 12353; длина контига от 200 до 299159 нуклеотидов. Далее представлена ссылка на таблицу контигов сборки: ссылка. Приведем ссылку на последовательность достаточно длинного контига (20520 нуклеотидов): ссылка
Опишем несколько ключей, используемых в базе данных NCBI:
gene 127766..130062 /locus_tag="TCM_000030" /note="dbxref CacaoGD:Thecc1EG000030"
CDS join(123902..124535,124693..125606,125707..125853) /locus_tag="TCM_000029" /note="dbxref ricco:28592.m000278; paralog of Thecc1EG015743t1" /codon_start=1 /product="Plant intracellular ras group-related LRR 4" /protein_id="EOX90603.1" /db_xref="TAIR:AT4G35470.1"
3'UTR 5584..5857
telomere complement(1..7223) /note="TEL16L; Telomeric region on the left arm of Chromosome XVI; annotated components include an X element core sequence, X element combinatorial repeats, and a long Y' element; TEL16L does have telomeric repeats (TEL16L-TR), but they are missing from the genome annotation due to difficulties encountered during sequencing and/or assembly"
stem_loop 63051..63194 /note="oriL palindrome"
rRNA <1..>776 /product="16S ribosomal RNA"
regulatory 22032..22060 /regulatory_class="promoter" /note="PcH1 promoter"
oriT 15948..16349 /standard_name="oriT"
mRNA join(127766..127901,127991..128023,128127..128223, 128301..128386,128475..128519,128657..128787, 129259..129369,129457..129890) /locus_tag="TCM_000030" /product="Translation initiation factor IF6 isoform 1" /inference="alignment:exonerate- protein:2:ricco:28592.m000280.2" /inference="similar to AA sequence (same species):CacaoGD:Thecc1EG043359t2" /inference="similar to AA sequence:ricco:28592.m000280" /note="transcript variant 1; alternatively spliced; quality class is strong, express is strong, homology is ortholog strong, intron is strong, protein is complete; similar to RNA sequence, EST 1.00 coverage; inference alignment:Newbler:10:TSA:cgbaP1_g02300t00001_C2"
ncRNA complement(join(70484..71246,71352..71508,75207..75371, 77975..78296)) /ncRNA_class="lncRNA" /gene="LOC105375113" /product="uncharacterized LOC105375113, transcript variant X3" /note="Derived by automated computational analysis using gene prediction method: Gnomon. Supporting evidence includes similarity to: 1 mRNA, 1 EST, and 100% coverage of the annotated genomic feature by RNAseq alignments" /transcript_id="XR_955329.2" /db_xref="GeneID:105375113"
Human Microbiome Project — коллекция данных о микроорганизмах, живущих в теле человека: бактерий, архей, вирусов и эукариот. Эти организмы обычно не наносят вреда человеку и выполняют ряд важных функций, в том числе синтез витаминов, обучение иммунной системы и борьбу с болезнетворными микроорганизмами.
В отличие от данных, получаемых методами традиционной микробиологии, информация, полученная в рамках проекта позволяет судить не только об отдельных видах, но о целых сообществах микроорганизмов, существующих в различных зонах внутри человеческого организма.
Приведем информацию по геномному проекту HMP:
Для поиска всех полных митохондриальных геномов таксона Rhizaria были использованы следующие запросы в NCBI Nuceotide:
Рассмотрим митохондриальный геном Paracercomonas marina. В результате поиска с запросом mitochondrion[Title] AND ("complete sequence"[Title] OR "complete genome"[Title]) AND "Paracercomonas marina"[Organism] AND ((ddbj_embl_genbank[filter]) OR (refseq[filter])) был получен митохондриальный геном. Далее представлена ссылка на таблицу, содержащую полные и короткие названия генов из этого генома, идентификаторы белков, координаты и ориентацию генов в цепи: pmarina.tsv