Банки нуклеотидных последовательностей


Что было сделано:


Задание 1

Название вида:

Краткое описание:

Внешний вид:

rock_pigeon

Источник:

Число сборок генома:

Информация о сборке:

Название (assembly name) Cliv_2.1
AC сборки из GenBank GCA_000337935.2 (latest)
assembly level Scaffold
Общая длина последовательности, п.о. 1,108,534,737
Число контигов 107,177
Число скэффолдов 15,057
N50 для контигов 26,627
L50 для контигов 12,120
N50 для скэффолдов 14,233,134
L50 для скэффолдов 17
число аннотированных белков 18,148
Ссылка на публикацию с описанием проекта PubMed
Ссылка на последовательность одного из контигов в формате .fasta туть

В отчете о сборке генома найдем строку WGS Project и нажмем на ссылку, ведущую проекту полного геномного секвенирования. Ищем в записи WGS (в самом конце). Жмакаем на ссылку и переносимся к списку контигов с ссылками на последовательности в формате .fasta (эти последовательности можно даже скачать). Недолго раздумывая, возьмем первый попавшийся контиг в списке. Его название ScoHet5_20, AC AKCR02000001.1, длина 94,473,889, ссылка на последовательность указана в талице.

Задание 2

Было дано задание найти последовательность CDS организма семейства вирусов-бактериофагов Inoviridae с длиной генома 6000-7000. Откроем NCBI, в строке поиска набираем:
(Inoviridae[Organism] AND 6000:7000[Sequence Length]) AND "Complete Genome"
ищем Nucleotide в разделе Genomes и радуемся жизни: нам удовлетворяет 60 записей с геномами.
Выберем какой-нибудь из геномов. Пусть это будет фаг спироплазмы - Spiroplasma phage SVTS2.


AC нуклеотидной записи NC_001270
латинское название вида Spiroplasma phage SVTS2
TaxID 93224
тип генома DNA, ss, кольцевой (подтверждение здесь)
хозяин вируса Spiroplasma
файл с кодирующими участками туть

Задание 3


Ключ Описание Пример
CDS указывает на белок-кодирующую последовательность cds
rep_origin указывает на ориджин репликации rep_origin
protein_bind указывает на сайт ДНК-белкового соединения protein_bind
tRNA указывает на зрелую тРНК trna
misc_structure указывает на последовательность, для которой существует информация о вторичной или третичной структуре misc_structures
misc_recomb указывает на вставленные или удаленные при рекомбинации участки misc_recomb.png
old_sequence указывает, что на данном участке представленной последовательности пересматривется предыдущая версия old_sequence


up

Правильный CSS!