Нуклеотидные банки данных

Задание 1

Индийский ящер (лат. Manis crassicaudata ) — млекопитающее из отряда Панголины, представители которого имеют характерные крупные черепицеобразные кератиновые чешуи на поверхности тела. Мясо и различные части тела этих животных активно используются в традиционной медицине, в особенности в азиатских странах. Несмотря на международный запрет на их торговлю, панголины являются одними из самых продаваемых млекопитающих в мире, из-за чего их численность с каждым годом сильно уменьшается. Индийские панголины встречаются в Южной Азии, преимущественно в Индии, восточном Пакистане, южном Непале, Бангладеше и Шри-Ланке и в данный момент находятся под угрозой исчезновения.

pangolin1
pangolin1

Число сборок 1
Assembly name DSBC_Mcra_1.0
GenBank assembly accession GCA_016801295.1
Assembly level Scaffold
Total sequence length 2,124,325,914
Number of contigs 833,272
Contig N50 7,447
Contig L50 68,288
Number of scaffolds 422,412
Scaffold N50 14,162
Scaffold L50 38,582
Публикация ссылка на PubMed
Файл с контигом ссылка
Таблица 1. Описание сборки генома индийского панголина.
Задание 2

Текст запроса:

((Sphaerolipoviridae[Organism]) AND 10000:20000[Sequence Length]) AND complete genome

Было получено 3 находки в RefSeq и 3 в GenBank. Далее рассматривается геном Natrinema virus SNJ1.

AC NC_003158
Organism Natrinema virus SNJ1
TaxID 1723446
Genome type circular dsDNA genome
Host Natrinema sp. J7-1

extremely halophilic Archaea

Таблица 2.
Файл с участками генома, предположительно кодирующими белки (CDS), доступен по ссылке. Чтобы получить файл, на странице с данными о геноме нажала 'send to file', затем 'coding sequences' и 'create file'.

Задание 3

- repeat_region - область генома, содержащая повторы. AC: NC_005038
            
     repeat_region   10984..11467
                     /note="repeat region 1; 484bp imperfect tandem repeat of
                     C-terminus of ORF_18"
                     
 
- rRNA - участок, кодирующий рРНК. AC: CP000936
    
     rRNA            15372..16805
                     /gene="rrs1"
                     /locus_tag="SPH_0016"
                     /product="16S ribosomal RNA"

 
- modified_base - модифицированный нуклеотид; должен быть заменен указанным в mod_base нуклеотидом. AC: NC_005859
    
     modified_base   complement(31671)
                     /gene="tRNAL1(UAG)"
                     /locus_tag="T5t10"
                     /mod_base=m6a
                     
 
- misc_structure - последовательность, для которой известна вторичная или третичная структура или конформация и которая не описывается другими структурными ключами (stem_loop и D-loop). AC: NG_044961
    
     misc_structure  892..1278
                     /experiment="EXISTENCE:in vitro cleavage assay evidence
                     [ECO:0001058][PMID:7853405]"
                     /note="cruciform structure or double stem-loop formed
                     between two Alu sequences and supported by P1 nuclease
                     cleavage"
                     /function="blocks enhancer activity"
                     /db_xref="GeneID:106699567"
            
 
- mobile_element - область генома, содержащая мобильные элементы. AC: NC_000019
    
        mobile_element  1212855..1212979
                     /note="direction; reverse; Derived by automated
                     computational analysis using gene prediction method:
                     RefSeqFE."
                     /rpt_family="Alu"
                     /rpt_type=dispersed
                     /mobile_element_type="SINE:AluJr"
                     /db_xref="GeneID:110006317"