Страница седьмого практикума


Эукариотический геном
Priapulus caudatus
Приапулида. Тело состоит из туловища и интроверта. Кутикула хитиновая, животное лиянет. На кутикулы расположены выросты - скалиды.
1 сборка
Priapulus_caudatus-5.0.1
GCF_000485595.1 - АС
Уровень сборки - Scaffold
511,738,253 - общая длина
59,587 скэффолдов
121,361 контигов
10,617 - N50 для контигов, 11,805 - L50 для контигов
209,727 - N50 для скэффолдов, 590 - L50 для скэффолдов
20692 белков
Статьи с описанием проекта не имеется
Последовательность контига



Вирусный геном
Поиск в NCBI Nucleotide по запросу (Myoviridae[Organism]) AND (60000:70000[sequence length])
По запросу 114 результатов на GenBank и 23 на RefSeq
MN176217 - AC
Escherichia phage vB_Eco4M-7, TaxID - 2601674
Геном: DNA, линейный, две цепи ДНК
Организм-хозяин - Бактерия, Escherichia coli
Последовательность CDS


Семь ключей
1. regulatory. Регуляторный участок. regulatory 127..131 /regulatory_class="ribosome_binding_site" /note="putative rRNA binding site"
2. CDS. Кодирующая последовательность.
CDS             190..255
                     /gene="thrL"
                     /locus_tag="ECRM12581_0005"
                     /note="involved in threonine biosynthesis; controls the
                     expression of the thrLABC operon; label: thrL CDS; leader;
                     Amino acid biosynthesis: Threonine"
                     /codon_start=1
                     /transl_table=11
                     /product="thr operon leader peptide"
                     /protein_id="AHY68531.1"
                     /translation="MKRISTTITTTITITTGNGAG"

3. variation. Указание на полиморфизм.
 variation       16198
                     /note="Variation type: SNP; Variations: G/A; Frequencies:
                     86.3/13.7; Amino acid change: His -> Tyr"

4. ncRNA. Некодирующая РНК.
 ncRNA           complement(317424..317647)
                     /ncRNA_class="snRNA"
                     /locus_tag="AGOS_AgSNR10"
                     /old_locus_tag="AgSNR10"
                     /product="AgSNR10"
                     /note="Identified by similarity to Saccharomyces
                     cerevisiae SNR10; start and end coordinates are
                     approximate; in synteny" 

5. misc_binding. Сайт в нуклеиновой кислоте, который подвержен ковалентному или нековалентному взаимодействию.
 misc_binding    213..233
                     /bound_moiety="miR390"

6. repeat_region. "Вставные" последовательности, транспозоны.
 repeat_region   3108125..3109272
                     /rpt_family="CRISPR"

7. polyA_site. Сайт полиаденилирования.
 polyA_site      2195
                     /gene="Dila-TPN"
                     /allele="Dila-TPN*0103"