Практикум 7

Задание 1. Сборка генома эукариотического организма

Selaginella moellendorffii (Плауно́к Мёллендорфа)

Пренадлежит к семейству Selaginellaceae. Имеет один из самых коротких геномов среди высших растений. Модельный объект (в том числе для эволюционных исследований).

красивое
Взяла из Википедии

Число сборок генома: 1

Assembly: GCA_000143415.2 v1.0

RefSeq assembly accession: GCF_000143415.4

Assembly level: Scaffold

Number of scaffolds 757

Scaffold N50 1,749,879

Scaffold L50 38

Number of contigs 5,152

Contig N50 119

Contig L50 514

PubMed link

Smallest contig

Задние 2

ЗАПРОС: 10000:20000[SLEN] AND Turriviridae[ORGANISM] AND Complete genome

ACCESSION NC_014099

ORGANISM Sulfolobus turreted icosahedral virus 2

Taxonomy ID: 754004

Genome: dsDNA, circular

Host: Sulfolobus turreted

fasta file

Путь получения: Send to -> Coding sequences -> create file

Задание 3

1. mRNA

Информационная РНК; включает 5'-нетранслируемую область (5'UTR), кодирующие последовательности (CDS, экзон) и 3'-нетранслируемую область (3'UTR);

     ACCESSION	OK032388
     mRNA            join(<304..618,1770..1941,2050..2185,2286..2499,
                     2659..2802,2893..3000,3073..3169,3246..3374,3473..3605,
                     3713..>3878)
                     /gene="LCYe"
                     /product="lycopene epsilon cyclase"

2. CDS

Кодирующая последовательность; последовательность нуклеотидов, которая соответствует последовательности аминокислот в белке (включая стоп-кодон); включает трансляцию аминокислот.

     ACCESSION	OK032388
     CDS             join(304..618,1770..1941,2050..2185,2286..2499,2659..2802,
                     2893..3000,3073..3169,3246..3374,3473..3605,3713..3878)
                     /gene="LCYe"
                     /EC_number="5.5.1.18"
                     /note="involved in carotenoid biosynthesis"
                     /codon_start=1
                     /product="lycopene epsilon cyclase"
                     /protein_id="UBZ25784.1"
                     /translation="MGLSGATISAPLGCCVLRCGAVGGGKALKADAERWRRAGWSRRV
                     GGPKVRCVATEKHDETAAVGAAVGVEFADEEDYRKGGGGELLYVQMQSTKPMESQSKI
                     ASKLSPISDENTVLDLVIIGCGPAGLSLASESAKKGLTVGLIGPDLPFTNNYGVWEDE
                     FKDLGLESCIEHVWKDTIVYLDNNKPILIGRSYGRVHRDLLHEELLRRCYEAGVTYLN
                     SKVDKIIESPDGHRVVCCDKGREIICRLAIVASGAASGRLLEYEVGGPRVCVQTAYGV
                     EVEVENNPYDPSLMVFMDYRDCFKEEFSHTEQENPTFLYAMPMSSTRVFFEETCLASK
                     DAMSFDLLKKRLMYRLNTMGIRILKVYEEEWSYIPVGGSLPNTDQKNLAFGAAASMVH
                     PATGYSVVRSLSEAPRYASVISDILGNRVPAEYMLGNSQNYSPSMLAWRTLWPQERKR
                     QRSFFLFGLALIIQLNNEGIQTFFEAFFRVPRWMWRGFLGSTLSSVDLILFSFYMFAI
                     APNQLRMNLVRHLLSDPTGSSMIKTYLTL"

3.intron

Участок ДНК, который транскрибируется, но удаляется из транскрипта путем сшивания последовательностей (экзонов) по обе стороны от него.

ACCESSION   M17185
...
FEATURES             Location/Qualifiers     
     intron          <1
                     /note="J-C intron"

3. souruce

Идентифицирует биологический источник указанной последовательности; этот ключ является обязательным; допускается более одного исходного ключа на последовательность; каждая запись будет иметь, как минимум, либо один ключ источника, охватывающий всю последовательность, либо несколько ключей источника, которые вместе охватывают всю последовательность.

ACCESSION   M17185
...
FEATURES             Location/Qualifiers
     source          1..300
                     /organism="Heterodontus francisci"
                     /mol_type="genomic DNA"
                     /db_xref="taxon:7792"
 

4. gap

Неппрочитанный фрагмент в последовательности

ACCESSION   OK032388
...
FEATURES             Location/Qualifiers
     gap             1121..1633
                     /estimated_length=513

5. gene

Регион, представляющий биологический интерес, идентифицированный как ген и которому было присвоено название.

ACCESSION   KJ946236
...
FEATURES             Location/Qualifiers

     gene            <1..>441
                     /gene="SLC14A1"