Практикум №7

Банки нуклеотидных последовательностей

Задание №1. Качество сборки генома эукариотического организма

Вид - Pantherophis guttatus (Полоз маисовый)

Pantherophis guttatus

Pantherophis guttatus

Краткое описание - в длину могут достигать 1,2—1,5 метров. В окраске наблюдается большое разнообразие, поэтому таких змей часто заводят в качестве домашних животных. Естественная окраска оранжевая с чёрными полосами и красными пятнами. Брюхо имеет сетчатый бело-чёрный рисунок

К сожалению, пока что существует всего лишь одна доступная сборка

Название сборки PanGut1.0
AC из GenBank GCA_001185365.1
Уровень сборки Scaffold
Общая длина 1,404,220,341
Число контигов 1,320,171
Число скэффолдов 883,920
N50 для контигов 2,394
L50 для контигов 138,295
N50 для скэффолдов 4,315
L50 для скэффолдов 78,031
Число аннотированных белков

Ссылка на описание проекта - GCA_001185365.1/

Ссылка на один из файлов с контигом - JTLQ01000002.1

Задание №2. Последовательности CDS одного из прокариотических вирусов

Текст запроса: "Siphoviridae"[Organism] AND ("90000"[SLEN] : "100000"[SLEN]) AND (complete[All Fields] AND genome[All Fields])

Всего было 43 находки: 14 из RefSeq (NCBI) и 29 из GenBank

AC нуклеотидной записи MK524501.1
Название Gordonia phage BrutonGaster
TaxID 2530116
Тип генома Кольцевая ds-DNA
Хозяин вируса Gordonia terrae 3612 (бактерия)

Получение кодирующей последовательности (CDS): Send to -> Coding Sequences -> File. Fasta-файл - JTLQ01000002.1

Задание №3.Ключи из таблиц особенностей

Ключ Значение Пример
CDS кодирующая последовательность
FEATURE         Location/Qualifiers            
 CDS            23..400
                /product="alcohol dehydrogenase" 
                /gene="adhI"
              
Последовательность 23..400 имеет своим продуктом алкогольдегидрогеназу и кодируется геном "adhI". Ключ координат кодирующей последовательности гена, которая соответствует аминокислотной последовательности в белке. Спецификаторы этого ключа часто указывают на название гена, кодируемого белка, его функции и др.
mRNA информационная РНК
FEATURE         Location/Qualifiers
mRNA                join(10..567,789..1320)
                /gene="ubc42"
Информационная РНК, включающая нетранслируемый 5' участок (5'UTR), кодирующие участки (CDS, exon) и 3' нетранслируемый участок (3'UTR);
tRNA зрелая транспортная РНК
FEATURE         Location/Qualifiers
tRNA            655..730  
                /gene="tRNA-Leu(UUR)"
                /anticodon=(pos:678..680,aa:Leu,seq:taa)
                /product="transfer RNA-Leu(UUR)"
Ключ, содержащий координаты кодирующей тРНК последовательности. Обычно в ключе указывается позиция антикодона в этой последовательности и аминокислота, которую несет конкретная тРНК.
regulatory любой участок последовательности,
принимающий участие в транскрипции,
трансляции, рипликации или упаковке хроматина.
FEATURE         Location/Qualifiers
regulatory      <1..9
                /gene="ubc42"
                /regulatory_class="promoter"
Ключ - идентификатор участков последовательности, вовлеченных в регуляцию транскрипции или трансляции. Обязательный спецификатор: /regulatory_class="TYPE".
source биологический источник образца
FEATURES        Location/Qualifiers
source          1..574052
                /organism="Cynoglossus semilaevis"
                /mol_type="genomic DNA"
                /isolate="Cse_v1.0"
                /db_xref="taxon:244447"
                /chromosome="6"
                /tissue_type="blood"
                /country="China"
                /collection_date="Sep-2009"
Source -обязательный ключ.
В классификаторах этого ключа содержится информация о получении образца (где, как, когда и т.д.)
V_region участки легких и тяжелых цепей иммуноглобулинов
FEATURES        Location/Qualifiers                					
V_region        1..277
                /gene="VFM1"
                /product="immunoglobulin heavy chain variable region" 
Вариабельные участки легких и тяжелых цепей иммуноглобулинов, α, β и γ-цепей Т-клеточных рецепторов.
sig_peptid кодирующая последовательность сигнального пептида
FEATURES        Location/Qualifiers                					


sig_peptide      1..54
                /gene="TCR1A" 
Указывает координаты кодирующей последовательности сигнального пептида.

Вернуться на главную страницу