Карась китайский (лат. Carassius auratus) по праву считается наиболее известным представителем аквариумистики. Впервые упомянутая в Китайских источниках в III в н.э. эта форма карася обыкновенного (лат. Carassius gibelio) подвергалась впоследствии многовой селекции, что стало основанием на выделение её в отдельный вид. Интересно, что процесс селекции данного вида начался с утраты спинного плавника[1] и к данному моменту дал более десятков тысяч разных пород. Золотые рыбки служат хорошим модельным объектом для токсинологии (легко поглощают вещества из окружающей среды), нейробиологии (способны регенерировать зрительный нерв), этологии и психологии (обладают неплохой памятью) и онкологии (высоко фоточувствительны).[2]
| Число сборок генома | 5 |
|---|---|
| Выбранная сборка | ASM336829v1 |
| AC (RefSeq) | GCF_003368295.1 |
| Assembly level | Хромосомный (Chromosome) |
| Общая длина | 1820.64 Mb (1,820,635,050) |
| Число контигов | 8463 |
| (N50, L50) контигов | 821,153 - 513 |
| Число скэффолдов | 6216 |
| (N50, L50) скэффолдов | 22,763,433 - 32 |
| BioProject (ссылка на публикацию) | PRJNA487739 |
| Последовательность контига | QPKE01000012.1 (tig00016849) |
Запрос: (( Pleolipoviridae[Organism]) AND 10000:20000[Sequence Length]) AND complete genome).
Количество находок: 14. (link). 9 GenBank и 5 RefSeq
| AC записи | NC_047943 |
|---|---|
| Организм | Haloarcula hispanica pleomorphic virus 4 (HHPV4) |
| TaxID | 1980140 |
| Taxonomy | Viruses; Monodnaviria; Trapavirae; Saleviricota; Huolimaviricetes; Haloruvirales; Pleolipoviridae; Betapleolipovirus; Betapleolipovirus HHPV4 |
| Тип генома | Circular dsDNA |
| Хозяин (Host) | Галофильная архея Haloarcula hispanica из Финляндии |
| Файл с CDS белков | ссылка |
Процедура получения файла с CDS: "Send to" → "Coding Sequences" → "Download features. FASTA Nucleotide". Файл сохранился в формате .txt, поэтому его расширение было изменено на .fasta
misc_binding участок последовательности, способный связываться ковалентно/нековалентно с другой молекулой (за исключением белков или праймеров)
AC: NZ_FKLX01000006
misc_binding 2860..3076
/inference="COORDINATES: nucleotide
motif:Rfam:14.4:RF00230"
/inference="COORDINATES: profile:INFERNAL:1.1.1"
/note="T-box leader; Derived by automated computational
analysis using gene prediction method: cmsearch."
/bound_moiety="tRNA"
/db_xref="RFAM:RF00230"
misc_structure последовательность, для которой известна вторичная и/или третичная структура или конформация, которая не описывается иными ключами о структуре (stem_loop или D-loop)
AC: NR_144567.1
misc_structure 8053..8145
/gene="MALAT1"
/gene_synonym="HCN; LINC00047; NCRNA00047; NEAT2; PRO2853"
/note="triple helical region (PMID:23073843)"
modified_base нуклеотид в последовательности модифицируется на указанный в переменной mod_base
AC: NC_001977.1
modified_base 1
/note="putative part of a cap structure that probably
occurs in all tymoviruses"
/mod_base=m7g
operon регион, с которого транскрибируется полицистронная РНК (несколько генов под контролем одних регуляторных последовательностей)
AC: EU262889.2
operon 76748..82268
/operon="psbB"
centromere участок интересный с биологической точки зрения, являющийся центромерой или выполняющий сходную функцию
AC: LR813563.2
centromere 249631..249749
/standard_name="CEN13"
/note="source:EM14S01-3B"