Банки нуклеотидных последовательностей

1.Характеристика качества сборки генома эукариотического организма

 ананасВ качестве многоклеточного организа был выбран ананас хохлатый (Ananas comosus). Что миру известно про этот вид?
Относится к высшим растениям, отдел цветковые, класс однодольные. Это тропическое многолетнее травянистое растение. Используется в качестве продукта питания. Употребляетс в сыром и консервированном виде, используется в кондитерской промышленности. Ананас обладает полезными свойствами благодаря комплексу биологически активных веществ. Культивируется во многих тропических странах.[1]

У данного организма имеется 3 сборки генома. 2 на уровне скэффолдов и 1 на уровне хромосом. Последнюю я посчитала лучшей.

assembly name ASM154086v1
AC (RefSeq) GCF_001540865.1
assembly level Chromosome
общая длина последовательности 382 055 938
число контигов 9 391
число скэффолдов 3 129
N50 для контигов 114 399
L50 для контигов 834
N50 для скэффолдов 11 759 267
L50 для скэффолдов 13
число аннотированных белков 35 775
публикация с описанием проекта 1, 2, 3, 4

последовательность контига

Последовательность данного контига на самом деле является целой хромосомой (так как рассматриваем сборку генома на уровне хромосом). NCBI Genome>Browse by Organism выдаёт таблицу со сборками генома для выбранного организма (Ananas comosus). Находим нужную нам сборку (AC - GCF_001540865.1), находим столбец WGS > переходим по ссылке > вкладка contigs. Я выбрала первую хромосому(AC - LODP01000001.1).

2.Скачайть последовательности CDS одного из прокариотических вирусов

Искала по Nucleotide на сайте NCBI с помощью 'Advanced search'
Текст запроса: 'Virus and Podoviridae and 40000:50000[Sequence length] and Complete genome '
В Genbank 55 находок, в Refseq - 37

AC нуклеотидной записи MK373773
латинское название и Tax ID вида Escherichia phage vB_EcoP_KAW1A4500,
2508205 
тип генома dsDNA, линейный
хозяин вируса бактерия E.coli
файл.fasta, с участками генома, предположительно кодирующими белки (CDS) файл

Как был получен файл: send to>Coding Sequences> Fasta Nucleotide> Create file

3.Опишисать семь ключей, используемых в таблицах особенностей

Описание Feature Keys получено из INSDC

Ключ Описание Пример
propeptide последовательность, кодирующая домен предшественника белка
 propeptide   join(241..550,603..971) 
              /gene="krtC"  
              /product="pro-neutral protease"

Источник(AC):AB781599
regulatory любой участок последовательность, который участвует в регуляции транскрипции, трансляции, репликации или структурировании хроматина
 regulatory   complement(25668..25767)
              /regulatory_class="riboswitch"
              /inference="COORDINATES: nucleotide
              motif:Rfam:12.0:RF00059"
              /inference="COORDINATES: profile:INFERNAL:1.1.1"
              /note="TPP riboswitch; Derived by automated computational
              analysis using gene prediction method: cmsearch."
              /bound_moiety="thiamine pyrophosphate"
              /db_xref="RFAM:RF00059"

Источник(AC):NZ_CABWFU010000059
STS (sequence tagged site), ДНК маркирующий сайт, уникальная короткая последовательность ДНК, расположенная в определённом (известном) месте генома
 STS           1120..1292
               /gene="CHTOP"
               /gene_synonym="C10orf77; C1orf77; FL-SRAG; FOP; pp7704;
               SRAG; SRAG-3; SRAG-5"
               /standard_name="SHGC-2950"
               /db_xref="UniSTS:92087"

Источник(AC):NM_001317077 
variation локальная особенность последовательности, например, полиморфизмы
 variation     758..764
               /gene="Arsb"
               /replace="cccccccc" 

Источник(AC):NM_033443
stem_loop Шпилька
 stem_loop     770..785
               /gene="H1-5"
               /gene_synonym="H1; H1.5; H1B; H1F5; H1s-3; HIST1H1B"
               /note="palindromic termination element"
               /function="transcription termination"

Источник(АС):NM_005322
sig_peptide последовательность, кодирующая: сигнальный пептид/ N-концевой домен секретируемого белка/ домен, вовлечённый в присоединении синтезирующегося полипетида к мембранной лидерной последовательности
sig_peptide    complement(6699..6776)
               /gene="fkpA"
               /locus_tag="ESCO44733_00008"
               /product="putative signal peptide"
               /inference="ab initio prediction:SignalP:4.1"
               /note="predicted cleavage at residue 26"

Источник(AC):CABHOE010000001
primer_bind cайт нековалентного связыввания праймера для инициации репликации, транскрипции, обратной транскрипции
 primer_bind   complement(169..189)
               /note="reverse_primer"
Источник(AC): LC430017

Источники

[1]информация об ананасе
[2]краткая информация о сборке