Практикум 7.

Задание 1.

Вид: Кукуруза сахарная (Zea mays subsp. mays).

Описание: Посевной кормовой и пищевой злак, родом из тропиков Южной Америки, одна из основных пищевых культур в мире. Большая часть сборок геномов проводилась агротехнологическими институтами. Имеет C4-фотосинтез и разнополые цветки, собранные по половому признаку в разные соцветия. Один из модельных объектов генетики, именно на ней были открыты транспозоны (за это Барбара МакКлинток получила Нобелевскую премию в 1983). Существует даже специальная база данных, посвящённая исследованиям генома кукурузы. [1]

Zea mays
Рисунок 1. Кукуруза сахарная (Zea mays), ботаническая иллюстрация из книги Köhler’s Medizinal-Pflanzen, 1887 (Wikimedia)

Число сборок генома (latest assemblies): 36 [2]

Assembly name: B73 RefGen_v4 [3]

GenBank AC: GCA_000005005.6

RefSeq AC: GCF_000005005.2

Assembly level: Chromosome

Total sequence length: 2,041,547,554

Number of scaffolds: 598

Scaffold N50: 10,525,104

Scaffold L50: 63

Number of contigs: 2,789

Contig N50: 1,279,870

Contig L50: 506

Число аннотированных белков: 131,270

Ссылка на публикацию: https://www.ncbi.nlm.nih.gov/pubmed/28605751

Ссылка на проект WGS [4] была в описании Assembly.

Был выбран контиг B73V4_ctg2 длиной 60,109 нуклеотидов, в котором описано 6 белков [5].

Скачать файл B73V4_ctg2.fasta

Задание 2

Текст запроса для NCBI Nucleotide: ("Podoviridae"[Organism]) AND (complete[All Fields] AND genome[All Fields]) AND ("20000"[SLEN] : "30000"[SLEN])

Находок в RefSeq: 9

Находок в GenBank: 38

Для дальнейшего исследования был отобран геном вируса Bacillus phage Aurora. [6]

RefSeq AC: NC_031121.1

Латинское название вида: Bacillus phage Aurora

Taxonomy ID вида: 1874000

Тип генома: линейный, dsDNA [7]

Хозяин вируса: Bacillus thuringiensis [8]

Получение файла со всеми CDS - Send to: > Coding Sequences > FASTA (Nucleotide).

Скачать файл с CDS вируса Bacillus phage Aurora

Задание 3

Ключи из таблиц особенностей, описания были получены с сайта www.insdc.org/documents/feature_table.html

regulatory - описывает участок генома, имеющий регуляторную функцию. Характеристики ключа - название гена, к которому он относится, и класс регуляторной последовательности.

Пример:

     regulatory      1..1665
                     /regulatory_class="promoter"
                     /gene="TERT"

Источник: https://www.ncbi.nlm.nih.gov/nuccore/AF098956.1


ncRNA - описывает участок генома, с которого транскрибируется РНК, однако эта РНК не кодирует белок. Обычно её функция - регуляция экспрессии генов.

Пример:

     ncRNA           complement(23312..24099)
                     /ncRNA_class="lncRNA"
                     /locus_tag="AT1G03993"
                     /product="other RNA"
                     /transcript_id="NR_138628.1"
                     /db_xref="GeneID:28716030"
                     /db_xref="Araport:AT1G03993"

Источник: https://www.ncbi.nlm.nih.gov/nuccore/NR_138628.1


STS - короткий участок ДНК, последовательность которого характерна для данных позиций в геноме. Обычно такому участку выдаётся собственное стандартное имя.

Пример:

     STS             107610..107759
                     /standard_name="agga182"
                     /db_xref="UniSTS:548123"

Источник: https://www.ncbi.nlm.nih.gov/nucleotide/NC_000932.1


Site - сайт связывания с ДНК какого-либо объекта (обычно регуляторного белка)

Пример:

     Site            order(445,468,470,473,477,481,485..486)
                     /site_type="other"
                     /note="histone binding site"
                     /db_xref="CDD:237991"

Источник: https://www.ncbi.nlm.nih.gov/protein/NP_001105167


stem_loop - вторичная труктура "шпилька" в РНК или одноцепочечной ДНК.

Пример:

     stem_loop       581..618
                     /note="stem-loop VI"
                     /function="interacts with translation initiation factor 4
                     gammaprotein (eIF4G)."

Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3


mics_structure - вторичная структура нуклеиновой кислоты, которая не подходит под другие ключи структур (например, stem_loop)

Пример:

     misc_structure  join(2..8,82..88)
                     /experiment="EXISTENCE:site-directed mutation[ 2170027;
                     20532207]"
                     /note="stem a"
                     /function="essential for the initiation of positive-strand
                     RNA synthesis"

Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3


5'UTR - нетраслируемый участок на 5' конце зрелой матричной РНК, либо нетраслируемый участок (до первого старт-кодона) на 5' конце РНК-генома вируса.

Пример:

     5'UTR           1..742
                     /experiment="EXISTENCE:[6264310 ]"
                     /function="The 5' non-translated region (NTR) harbors two
                     functional domains, the cloverleaf and the internal
                     ribosome entry site (IRES), and is covalently linked to
                     the viral protein VPg."

Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3


conflict - несовпадение между приведённой в RefSeq/GenBank последовательностью ДНК и этой же последовательностью в ином источнике.

Пример:

     conflict        352
                     /note="G is U in [3]"
                     /citation=[21]

Источник: https://www.ncbi.nlm.nih.gov/nuccore/NC_002058.3

Источники информации:

  1. maizegdb.org/
  2. ncbi.nlm.nih.gov/assembly/organism/4577/latest/
  3. ncbi.nlm.nih.gov/assembly/GCF_000005005.2/
  4. ncbi.nlm.nih.gov/nuccore/LPUQ00000000.1/
  5. ncbi.nlm.nih.gov/Traces/wgs/LPUQ01?display=contigs&page=1
  6. ncbi.nlm.nih.gov/nuccore/NC_031121.1
  7. viralzone.expasy.org/520
  8. genome.jp/virushostdb/1874000