Работа с нуклеотидными базами данных

Сборка генома Carassius auratus

Золотая рыбка(Carassius auratus) породы wakin. Фотография @oda.min_1122

Карась китайский (лат. Carassius auratus) по праву считается наиболее известным представителем аквариумистики. Впервые упомянутая в Китайских источниках в III в н.э. эта форма карася обыкновенного (лат. Carassius gibelio) подвергалась впоследствии многовой селекции, что стало основанием на выделение её в отдельный вид. Интересно, что процесс селекции данного вида начался с утраты спинного плавника[1] и к данному моменту дал более десятков тысяч разных пород. Золотые рыбки служат хорошим модельным объектом для токсинологии (легко поглощают вещества из окружающей среды), нейробиологии (способны регенерировать зрительный нерв), этологии и психологии (обладают неплохой памятью) и онкологии (высоко фоточувствительны).[2]

Число сборок генома 5
Выбранная сборка ASM336829v1
AC (RefSeq) GCF_003368295.1
Assembly level Хромосомный (Chromosome)
Общая длина 1820.64 Mb (1,820,635,050)
Число контигов 8463
(N50, L50) контигов 821,153 - 513
Число скэффолдов 6216
(N50, L50) скэффолдов 22,763,433 - 32
BioProject (ссылка на публикацию) PRJNA487739
Последовательность контига QPKE01000012.1 (tig00016849)

CDS представителя Pleolipoviridae

Запрос: (( Pleolipoviridae[Organism]) AND 10000:20000[Sequence Length]) AND complete genome).
Количество находок: 14. (link). 9 GenBank и 5 RefSeq

AC записи NC_047943
Организм Haloarcula hispanica pleomorphic virus 4 (HHPV4)
TaxID 1980140
Taxonomy Viruses; Monodnaviria; Trapavirae; Saleviricota; Huolimaviricetes; Haloruvirales; Pleolipoviridae; Betapleolipovirus; Betapleolipovirus HHPV4
Тип генома Circular dsDNA
Хозяин (Host) Галофильная архея Haloarcula hispanica из Финляндии
Файл с CDS белков ссылка

Процедура получения файла с CDS: "Send to" → "Coding Sequences" → "Download features. FASTA Nucleotide". Файл сохранился в формате .txt, поэтому его расширение было изменено на .fasta

Ключи локальных особенностей

misc_binding участок последовательности, способный связываться ковалентно/нековалентно с другой молекулой (за исключением белков или праймеров)

AC: NZ_FKLX01000006

   misc_binding    2860..3076
                        /inference="COORDINATES: nucleotide
                         motif:Rfam:14.4:RF00230"
                        /inference="COORDINATES: profile:INFERNAL:1.1.1"
                        /note="T-box leader; Derived by automated computational
                         analysis using gene prediction method: cmsearch."
                        /bound_moiety="tRNA"
                        /db_xref="RFAM:RF00230"


misc_structure последовательность, для которой известна вторичная и/или третичная структура или конформация, которая не описывается иными ключами о структуре (stem_loop или D-loop)

AC: NR_144567.1

   misc_structure  8053..8145
                        /gene="MALAT1"
                        /gene_synonym="HCN; LINC00047; NCRNA00047; NEAT2; PRO2853"
                        /note="triple helical region (PMID:23073843)" 


modified_base нуклеотид в последовательности модифицируется на указанный в переменной mod_base

AC: NC_001977.1

   modified_base   1
                        /note="putative part of a cap structure that probably
                               occurs in all tymoviruses"
                        /mod_base=m7g


operon регион, с которого транскрибируется полицистронная РНК (несколько генов под контролем одних регуляторных последовательностей)

AC: EU262889.2

   operon          76748..82268
                        /operon="psbB" 


centromere участок интересный с биологической точки зрения, являющийся центромерой или выполняющий сходную функцию

AC: LR813563.2

   centromere      249631..249749
                        /standard_name="CEN13"
                        /note="source:EM14S01-3B"


References
  1. Komiyama T. et al. An evolutionary origin and selection process of goldfish //Gene. – 2009. – Т. 430. – №. 1-2. – С. 5-11.
  2. "The epic history of the humble goldfish" by Cathy Newman // National geographic