Практикум 7.
Задание 1.
Вид: Кукуруза сахарная (Zea mays subsp. mays).
Описание: Посевной кормовой и пищевой злак, родом из тропиков Южной Америки, одна из основных пищевых культур в мире. Большая часть сборок геномов проводилась агротехнологическими институтами. Имеет C4-фотосинтез и разнополые цветки, собранные по половому признаку в разные соцветия. Один из модельных объектов генетики, именно на ней были открыты транспозоны (за это Барбара МакКлинток получила Нобелевскую премию в 1983). Существует даже специальная база данных, посвящённая исследованиям генома кукурузы. [1]
![Zea mays](pr7/zeamays.png)
Число сборок генома (latest assemblies): 36 [2]
Assembly name: B73 RefGen_v4 [3]
GenBank AC: GCA_000005005.6
RefSeq AC: GCF_000005005.2
Assembly level: Chromosome
Total sequence length: 2,041,547,554
Number of scaffolds: 598
Scaffold N50: 10,525,104
Scaffold L50: 63
Number of contigs: 2,789
Contig N50: 1,279,870
Contig L50: 506
Число аннотированных белков: 131,270
Ссылка на публикацию: https://www.ncbi.nlm.nih.gov/pubmed/28605751
Ссылка на проект WGS [4] была в описании Assembly.
Был выбран контиг B73V4_ctg2 длиной 60,109 нуклеотидов, в котором описано 6 белков [5].
Задание 2
Текст запроса для NCBI Nucleotide: ("Podoviridae"[Organism]) AND (complete[All Fields] AND genome[All Fields]) AND ("20000"[SLEN] : "30000"[SLEN])
Находок в RefSeq: 9
Находок в GenBank: 38
Для дальнейшего исследования был отобран геном вируса Bacillus phage Aurora. [6]
RefSeq AC: NC_031121.1
Латинское название вида: Bacillus phage Aurora
Taxonomy ID вида: 1874000
Тип генома: линейный, dsDNA [7]
Хозяин вируса: Bacillus thuringiensis [8]
Получение файла со всеми CDS - Send to: > Coding Sequences > FASTA (Nucleotide).
Скачать файл с CDS вируса Bacillus phage Aurora
Задание 3
Ключи из таблиц особенностей, описания были получены с сайта www.insdc.org/documents/feature_table.html
regulatory - описывает участок генома, имеющий регуляторную функцию. Характеристики ключа - название гена, к которому он относится, и класс регуляторной последовательности.
Пример:
regulatory 1..1665 /regulatory_class="promoter" /gene="TERT"
Источник: https://www.ncbi.nlm.nih.gov/nuccore/AF098956.1
ncRNA - описывает участок генома, с которого транскрибируется РНК, однако эта РНК не кодирует белок. Обычно её функция - регуляция экспрессии генов.
Пример:
ncRNA complement(23312..24099) /ncRNA_class="lncRNA" /locus_tag="AT1G03993" /product="other RNA" /transcript_id="NR_138628.1" /db_xref="GeneID:28716030" /db_xref="Araport:AT1G03993"
Источник: https://www.ncbi.nlm.nih.gov/nuccore/NR_138628.1
STS - короткий участок ДНК, последовательность которого характерна для данных позиций в геноме. Обычно такому участку выдаётся собственное стандартное имя.
Пример:
STS 107610..107759 /standard_name="agga182" /db_xref="UniSTS:548123"
Источник: https://www.ncbi.nlm.nih.gov/nucleotide/NC_000932.1
Site - сайт связывания с ДНК какого-либо объекта (обычно регуляторного белка)
Пример:
Site order(445,468,470,473,477,481,485..486) /site_type="other" /note="histone binding site" /db_xref="CDD:237991"
Источник: https://www.ncbi.nlm.nih.gov/protein/NP_001105167
stem_loop - вторичная труктура "шпилька" в РНК или одноцепочечной ДНК.
Пример:
stem_loop 581..618 /note="stem-loop VI" /function="interacts with translation initiation factor 4 gammaprotein (eIF4G)."
Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3
mics_structure - вторичная структура нуклеиновой кислоты, которая не подходит под другие ключи структур (например, stem_loop)
Пример:
misc_structure join(2..8,82..88) /experiment="EXISTENCE:site-directed mutation[ 2170027; 20532207]" /note="stem a" /function="essential for the initiation of positive-strand RNA synthesis"
Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3
5'UTR - нетраслируемый участок на 5' конце зрелой матричной РНК, либо нетраслируемый участок (до первого старт-кодона) на 5' конце РНК-генома вируса.
Пример:
5'UTR 1..742 /experiment="EXISTENCE:[6264310 ]" /function="The 5' non-translated region (NTR) harbors two functional domains, the cloverleaf and the internal ribosome entry site (IRES), and is covalently linked to the viral protein VPg."
Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3
conflict - несовпадение между приведённой в RefSeq/GenBank последовательностью ДНК и этой же последовательностью в ином источнике.
Пример:
conflict 352 /note="G is U in [3]" /citation=[21]
Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3