Банки нуклеотидных последовательностей. Часть 1

Задание 1.

Для выполнения этого задания был выбран организм Sus scrofa (свинья).
Существуют дикие и одомашненные подвиды, которые отличаются морфологически, а также имеют разные кариотипы. В проектах по секвенированию использовалась домашняя свинья, имеющая 18 аутосом и 2 половые хромосомы (X и Y).

Рис1. Домашняя свинья.


Свиньи, помимо использования в мясной промышленности, представляют большой интерес для науки, ведь они являются модельными организмами для многих медицинских исследований, в том числе ожирения, диабета, алкоголизма, сердечно-сосудистых заболеваний, заболеваний почек, эндокринологических проблем, трансплантации органов и так далее.


На данный момент есть 11 проектов по секвенированию 5 образцов.
Пока что существует 5 сборок генома.
Была выбрана лучшая из сборок: GCF_000003025.5


Задание 2.

Мне был выдан мох под названием отротрихум красивый (Orthotrichum speciosum). Запись с его митохондриальным геномом была найдена по запросу Orthotrichum speciosum[Organism] AND mitochondrion complete genome, произведенному в базе данных Nucleotide.
Запись NC_026121.1


Рис2. Ортотрихум красивый.



Рис3. Расположение генов в митохондриальном геноме отротрихума красивого.


Задание 3.

Таблица 1. Ключи, используемые в таблицах особенностей.

Ключ Описание Пример
CDS Кодирующая последовательность и ее трансляция
 join(17898..18763,19532..20120)
                     /gene="ccmFC"
                     /locus_tag="SJ96_p32"
                     /codon_start=1
                     /product="cytochrome c biogenesis factor C"
                     /protein_id="YP_009115184.1"
                     /db_xref="GI:746948582"
                     /db_xref="GeneID:22833950"
                     /translation="MVQLQNFFFFLMFMVVLCGTAAPILFQWLVSRDVPTGAPFSHGT
                     IIPIFTSLLLLLVHVHSRGFIRSMEKTERIVLVKAKRILLLNIIEKSSPKTRAKNAFF
                     FFFFFFSNFFIFKFMGDLSYLESFCSVLCFLLFCTFFLSFKYRRDTWANEERRLGMEE
                     KRKPRKRAQRRKRQALCWPDRKKKQRNKKKQNFSFLFLSNKSKIFLIYLLQFSKTFGF
                     NEKTKILAFYSLLAFLQAYSFVLENIWNKFFIVRALPKRLMDVGHDFRKVPMTMKISH
                     GGVCIFIMGVILSNTKKRQFTQLLPLGSELHIGREHCCLRAIDQLHGPTFHSICGNLI
                     IYKPSLKNPFIFDYDESLRAIIDLLPLAALSYQNEKVEKKYIYFFSTFFHGDRSWRNR
                     EHHSFPLWLTVFPEKRFSFSNRETSTTKVAIHSNLFTDLYALIGTGSFETGWYITIMK
                     LPFIFCIWIGFILASLGGLCSFLRQLALYRLDWN"
intron Последовательность интрона
 18764..19531
                     /gene="ccmFC"
                     /locus_tag="SJ96_p32"
                     /note="group II intron"
V_region Вариабельный участок белка (как правило, имеются в виду иммуноглобулины)
1..277
                /gene="VFM1"
                /product="immunoglobulin heavy chain variable region"
source Источник последовательности
1..2245
                /organism="Escherichia coli"
                /plasmid="Plasmid XYZ"
                /strain="K12"
                /mol_type="genomic DNA"
sig_peptide Последовательность, кодирующая сигнальный пептид
1..54
                /gene="TCR1A"
repeat_region Участок с повторяющимися элементами
80..401
                /rpt_type=DISPERSED
                /rpt_family="Alu-J"
-35_signal Последовательность -35 региона, также известная как ТАТА-бокс или бокс Гольдберга-Хогнесса
160..165
                /operon="gal"
-10_signal Последовательность -10 региона, также известная как Прибнов-бокс
179..184
                /operon="gal"
rep_origin Ориджин репликации - последовательность, с которого начинается репликация
6
                /direction=LEFT
                /note="ori"
mat_peptide Последовательность зрелого пептида, прошедшего посттрансляционные модификации
 55..399
                /gene="TCR1A"
                /product="T-cell receptor alpha chain"


Назад к странице третьего семестра.


© Aleksei Efremov, 2015