Нуклеотидные банки данных

Описание сборки генома Sarcophilus harrisii

Nucl
Рис. 1. Sarcophilus harrisii (ссылка на фото)
Тасманийский дьявол (сумчатый черт, тасманский дьявол, Sarcophilus harrisii) - хищное сумчатое млекопитающее родом из Австралии, чье видовое название чаще ассоциируется с персонажем мультфильма Lonely Tunes студии Warner Bros. Вид представляет биологическую ценность, так как для него характерен весьма редкий и необычный тип рака - трансмиссивная лицевая опухоль тасманийского дьявола (devil facial tumor disease, DFTD). Рак возникает из шванновских клеток.
Число сборок генома 7
Выбранная сборка mSarHar1.11
AC (RefSeq) GCF_902635505.1
Assembly level Хромосомный
Общая длина 3,087 Mpb (3,086,674,442 bp)
Число контигов 445
(N50, L50) контигов 62,339,597 - 14
Число скэффолдов 106
(N50, L50) скэффолдов 611,347,268 - 3
BioProject (ссылка на публикацию) PRJEB35073
Последовательность контига CACPPN010000040.1

CDS представителя Siphoviridae

Запрос:((Siphoviridae[Organism]) AND 60000:70000[Sequence Length]) AND complete genome)

Число находок: 1000 (GenBank: 761, RefSeq: 223)

Организм Gordonia phage DoctorFroggo
АС записи MZ322020.1
TaxID 2851096
Taxonomy Viruses; Duplodnaviria; Heunggongvirae; Uroviricota; Caudoviricetes; Caudovirales; Siphoviridae; Gordonia phage DoctorFroggo
Тип генома Линейная dsDNA
Хозяин Актиномицет Gordonia terrae 3612, вызывающий легочные заболевания
Файл с CDS белков FASTA-файл

Файл был получен следующим путем: на странице сборки Send to -> Coding sequences -> File

Ключи локальных особенностей

D-loop - D-петля; участок митохондриальной ДНК, с одной из цепей которого связывается РНК

AC: MW555060

	D-loop          1..180
                     /note="control region"
	


regulatory - любой участок последовательности, который регулирует транскрипцию, трансляцию, репликацию, рекомбинацию или структуру хроматина

AC: NZ_JAJQMQ010000041

	regulatory      11729..11829
                     /regulatory_class="riboswitch"
                     /inference="COORDINATES: nucleotide
                     motif:Rfam:14.4:RF00059"
                     /inference="COORDINATES: profile:INFERNAL:1.1.1"
                     /note="TPP riboswitch; Derived by automated computational
                     analysis using gene prediction method: cmsearch."
                     /bound_moiety="thiamine pyrophosphate"
                     /db_xref="RFAM:RF00059"
	


rep_origin - точка инициации репликации

AC: LC664019

	rep_origin      5301..5335
                     /note="putative Light-strand replication origin with
                     hairpin secondary structure"
	


S_region - участок переключения между тяжелыми цепями иммуноглобулина; вовлечен в перестановку тяжелых цепей, ведущую к экспрессии разных классов иммуноглобулинов одним и тем же В-лимфоцитом

AC: MP887560

	S_region        2550..4451
                     /note="Mouse IgM switch region (mouse sequence)"
	


stem_loop - шпилька; двуцепочечный участок, формируемый взаимодействием инвертированных последовательностей (таких, что их можно получить друг из друга зеркальным отражением) одноцепочечных РНК или ДНК

AC: OL913104

	stem_loop       29609..29644
                     /gene="ORF10"
                     /note="Coronavirus 3' UTR pseudoknot stem-loop 1"