Я взял домашнюю собаку Canis lupus familiaris, одно из наиболее популярных домашних животных. Плацентарное млекопитающее семейства хищных. Выведено множество различных пород собак для различных целей (охоты, декоративных, транспортировки). Считается, что собака была выведена в Старом Свете в эпоху верхнего палеолита. Генетические исследования показали, что волк и собака отделились приблизительно 135 тысяч лет назад.
Информация о сборке генома лабрадора-ретривера:
Для поиска генома нужного вируса я воспользовался в NCBI следующим запросом: "Leviviridae"[Organism] AND 00000004000[SLEN] : 00000005000[SLEN]) AND "complete genome"[All Fields]. Это позволило найти вирусы из нужного семейства с размером генома 4-5 тысяч п.н. Количество находок в GenBank составило 12, а в RefSeq - 2.
Organism: Enterobacteria phage NL95 (NCBI:txid75725)
AC: AF059243.1
Геном представлен одноцепочечной РНК(+)
Хозяинами являются бактерии из семейства Enterobacteriaceae, включающее в себя множество патогенных (и не очень) грамотрицательных микроорганизмов (например, сальмонелла, кишечная палочка, чумная малочка и т.д.). Обитают в микрофлоре кишечника, почве, водоемах или даже паразитируют на растениях.
regulatory определяет области последовательности, участвующие в регуляции каких-либо процессов (например, сигнал образования полиА-хвоста, промотор, энхансер и т.д.).
NM_018947.6
regulatory 5411..5416 /regulatory_class="polyA_signal_sequence" /gene="CYCS" /gene_synonym="CYC; HCS; THC4" /note="hexamer: AATAAA"
exon определяет область экзона, то есть участка, который остается после сплайсинга.
X53310
exon 387..561 /gene="penDE" /number=2
intron определяет область интрона, то есть участка, который удаляется во время сплайсинга.
M37262.1
intron 2612..2685 /note="alcohol dehydrogenase intron B"
mat-peptide определяет область, которая остается после протеолитического созревания белка.
AB701735.1
mat_peptide 1181..2554 /product="HC-Pro protein"
polyA_site определяет область начала полиА-хвоста.
NM_006573.5
polyA_site 2576 /gene="TNFSF13B" /gene_synonym="BAFF; BLYS; CD257; DTL; TALL-1; TALL1; THANK; TNFSF20; TNLG7A; ZTNF4" /note="major polyA site"