Банки нуклеотидных последовательностей
Для того, чтобы найти геном, удовлетворяющих данному семейству и длине, в расширенном поске NCBI были указаны следующие параметры:
(Rudiviridae[Organism]) AND 30000:40000[Sequence Length] AND complete genomeПо моему запросу было предложено 4 генома из Gene Bank, 11 из RefSeq (это очень странно), среди которых я выбрала полный геном вируса - Sulfolobales Beppu rod-shaped virus 1 clone D
Далее привожу для него некоторую информацию:
Чтобы получить ссылку на файл .fasta с участками генома, предположительно кодирующими белки(CDS): Send to → Coding Sequences → FASTA Nucleotide. файл
Описание было найдено на сайте INSDC в разделе 7.2 Appendix II: Feature keys reference.
Название ключа | Описание ключа | Пример использования |
centromere | Центромера описывает интервал ДНК, на котором удерживаются хроматиды, формируя хромосому | 555957..556073 /note="CEN16; Chromosome XVI centromere" /db_xref="SGD:S000006477" |
misc_feature | Область генома, которая не может быть описана любым другим функциональным ключом в связи с её неизвестной или редкой функцией | 97861..97960 /note="16S ribosomal RNA rRNA prediction is too short" |
mobile_element | Описывает расположение и вид элементов, которые могут перемещаться внутри генома. Существует несколько классов мобильных элементов генома, отличающихся по строению и способу перемещения. Например: транспозоны и ретротранспозоны. | 1..2266 /mobile_element_type="integron:class 1" | ncRNA | Область генома, соответствующая некодирующим РНК, то есть тем, которые не транслируются в белки. К некодирующим РНК относят тРНК и рРНК. Последовательность ДНК, на которой транскрибируются некодирующие РНК, часто называют РНК-геном | 35765..35862 /ncRNA_class="SRP_RNA" /gene="ffs" /locus_tag="GDN47_RS27750" /product="signal recognition particle sRNA small type" /inference="COORDINATES: nucleotide motif:Rfam:12.0:RF00169" /inference="COORDINATES: profile:INFERNAL:1.1.1" /note="Derived by automated computational analysis using gene prediction method: cmsearch." /db_xref="RFAM:RF00169" | polyA_site | Предоставляет информацию о сайте мРНК, к которому присоединяется большое количество остатков аденозинмонофосфата(к 3'-концу первичной мРНК) в ходе процессинга | 1329 /gene="INHA" /note="polyadenylation site" | regulatory | Любая область последовательности, функцией которой является регуляция транскрипции, трансляции, репликации |
9002..9119 /regulatory_class="riboswitch" /inference="COORDINATES: nucleotide motif:Rfam:12.0:RF00634" /inference="COORDINATES: profile:INFERNAL:1.1.1" /note="SAM riboswitch class IV; Derived by automated computational analysis using gene prediction method: cmsearch." /bound_moiety="S-adenosylmethionine" /db_xref="RFAM:RF00634" |
unsure | Небольшая область генома, обычно 10 пар оснований, в нуклеотидной последовательности которой учёные не уверены (в этой области могут встретиться как A. T, G, C, так и N) |
161..166 /gene="Noc3l" /gene_synonym="AF233884; Fad24" /note="<30 qual single clone coverage" |