Нуклеотидные банки данных

Meloidogyne incognita

Meloidogyne incognita — вид круглых червей семейства Meloidogynidae. Вид широко распространен во многих типах почв. Meloidogyne incognita встречается по всему миру. Meloidogyne incognita - паразит растений, образующий на корнях галлы. Самки откладывают яйца в галлы кладкой до 2000 яиц. Растения, пораженные этим видом круглых червей, отстают в росте и преждевременно отмирают, т.к. закупорка проводящих сосудов корня препятствует поступлению в растения питательных веществ и воды. Нематода может паразитировать на 3000 видов растений.
Число сборок генома: 4

Рис.1 Meloidogyne incognita (root-knot nematode)

Assembly name: ASM369364v1
GenBank assembly accession: GCA_003693645.1
Assembly level: Scaffold
Total sequence length 121,964,221
Number of scaffolds 33,351
Number of contigs 39,919
Scaffold N50 16,520
Scaffold L50 1,989
Публикация про нематоду можно увидеть на сайте PubMed, пройдя по ссылке.
Ссылка на последовательность одного из контигов в формате .fasta.

CDS одного из прокариотических вирусов

Текст запроса: 10000:20000[Sequence Length] AND Fuselloviridae[Organism] AND complete genome;
Количество находок в GenBank:50 и RefSeq: 9.
AC: NC_001338
Латинское название: Sulfolobus spindle-shaped virus 1; Viruses; Fuselloviridae; Alphafusellovirus
Тип генома: dsDNA, circular;
(Согласно информации из статьи по ссылке, Fuselloviruses представляют собой фаги с двухцепочной ДНК. Ссылка)
Host: не указано;
Ссылку на файл fasta-файл с участками генома, предположительно кодирующими белки (CDS). Не обходимо выбрать опции: "Send to" > "Coding Sequences" > Format:"FASTA Nucleotide" > "Create file".

Пять ключей, используемых в таблице локальных особенностей

exon область генома, которая кодирует часть сплайсированной мРНК, рРНК и тРНК

NM_001123235

exon          1..402
                     /gene="arhgef7a"
                     /gene_synonym="fc28d09; wu:fc28d09"
                     /inference="alignment:Splign:2.1.0"

sig_peptide последовательность кодирования сигнального пептида

NM_009841

sig_peptide     325..369
                     /gene="Cd14"
                     /note="propagated from UniProtKB/Swiss-Prot (P10810.1)"

mat_peptide последовательность кодирования зрелого пептида или белка

NM_009841

mat_peptide     370..1332
                     /gene="Cd14"
                     /product="Monocyte differentiation antigen CD14.
                     /id=PRO_0000020887"
                     /note="propagated from UniProtKB/Swiss-Prot (P10810.1)"

intron сегмент ДНК, который транскрибируется, но удаляется из транскрипта путем сращивания последовательностей (экзонов) по обе стороны от него

AJ271079

intron          complement(1612..4082)
                     /gene="trnK-UUU"

ncRNA ген, не кодирующий белок, отличный от рибосомной РНК (рРНК) и трансферной РНК (тРНК), функциональной молекулой которого является транскрипт РНК

NG_011594

ncRNA           complement(join(58796..60991,62151..62254,65569..65745))
                     /ncRNA_class="lncRNA"
                     /gene="DIAPH1-AS1"
                     /product="DIAPH1 antisense RNA 1"
                     /transcript_id="NR_038333.1"
                     /db_xref="GeneID:100505658"
                     /db_xref="HGNC:HGNC:40177"