Практикум 7.

Описание сборки генома эукариотического организма

CDS одного из прокариотических вирусов

Список полных геномов вирусов семейства Siphoviridae длины от 30 до 40 Kb. Текст запроса: Siphoviridae[PORG] AND 30000:40000[SLEN] AND "complete genome"[All Fields]. INSDC (GenBank)(1,379) RefSeq(298).

Описание пяти ключей, используемых в таблице локальных особенностей.

  1. CDS - кодирующая последовательность, то есть отвечающая аминокислотной последовательности в белке.

    CDS             172..1953
                         /gene="Slc26a11"
                         /note="solute carrier family 26 (anion exchanger), member
                         11"
                         /codon_start=1
                         /product="sodium-independent sulfate anion transporter"
                         /protein_id="NP_001385736.1"
                         /db_xref="GeneID:360670"
                         /db_xref="RGD:1306178"
                         /translation="MAPDTHCCSRADLRRRLPVLAWLPNYSLRWLRMDVIAGLSVGLT
                         VIPQALAYAEVAGLPPQYGLYSAFMGCFVYFVLGTSRDVTLGPTAIMSLLVSYYTFRE
                         PAYAVLLAFLSGCIQLAMGLLHLGFLLDFISCPVIKGFTSAASITIGFGQVKNLLGLQ
                         NIPRQFFLQVYHTFLHIGETRVGDAILGLVCMVLLLVLKLMREHIPPPHPEMPLGVKF
                         SRGLVWTVTTARNALVVSFAALIAYAFEVTGSHPFILTGKIAQGLPPVRMPPFSVTTD
                         NKTISFSEMVQDMGVGLAVVPLMGLLETIAVAKSFASQNNYRIDANQELLAIGLTNVL
                         GSLVSSYPVTGSFGRTAVNAQTGVCTPAGGLVTGVLVLLSLDYLTLLFYYIPKSALAA
                         VIIMAVAPLFDVKIFRRLWLVQRLDLLPLCVTFLLSFWEIQYGILAGTLVSLLILLHS
                         VARPKTQVSEGQILVLQPASGLHFPAVDALREAMTKRALEASPPRSAVLECTHVSNID
                         YTVILGLGELLEDFQKKGVTLAFVGLQVPVLRTLLAADLKGFQYFTTLEEAEKSLQQE
                         PGTQPYSIREDTAPEHRSSLLKSPSGP"
  2. exon - участок генома, кодирующий часть сплайсированной РНК.

    exon            355..547
                         /gene="Slc26a11"
                         /inference="alignment:Splign:2.1.0"
  3. modified_base - модифицированный нуклеотид.

    modified_base   1
                         /note="m7Gppp cap"
                         /mod_base=OTHER
  4. ncRNA - не белок кодирующая, не рибосомальная и не транспортная РНК.

    ncRNA           1186523..1186890
                         /ncRNA_class="RNase_P_RNA"
                         /gene="rnpB"
                         /locus_tag="KCP69_06405"
                         /product="RNase P RNA component class A"
                         /inference="COORDINATES: nucleotide
                         motif:Rfam:12.0:RF00010"
                         /inference="COORDINATES: profile:INFERNAL:1.1.1"
                         /note="Derived by automated computational analysis using
                         gene prediction method: cmsearch."
                         /db_xref="RFAM:RF00010"
  5. old_sequence - предыдущуая версия последовательности этого участка.

    old_sequence    300..302
                         /note="gac was cga"
                         /citation=[3]