Банки нуклеотидных последовательностей
Что было сделано:
- было охарактеризовано качество сборки генома эукариотического организма (Сизого голубя);
- были загружены последовательности CDS одного из прокариотических вирусов;
- было описано семь ключей, используемых в таблицах особенностей.
Задание 1
Название вида:
- Сизый голубь (Columba livia)
Краткое описание:
- Широко распространенная, одна из первых прирученных человеком птица семейства Голубиные.
- Обычно селится в прибрежных скалах, вдоль обрывистых берегов рек, вблизи зарослей кустарников в дикой природе.
- Легко адаптированы к жизни возле человеческого жилья. В природе живут 3-5 лет, одомашненные особи доживают до 15 лет.
- Оперение густое и плотное, окрас разнообразный.
- Как правило, голова, шея и грудь пепельно-сизые с зеленоватым, желтоватым либо пурпурным металлическим отливом на шее и груди.
Такой же отлив может быть выражен на кроющих перьях крыла.
Внешний вид:
Источник:
Число сборок генома:
- на NCBI существуют две сборки генома. Я выбрала самую новую.
Информация о сборке:
Название (assembly name) |
Cliv_2.1 |
AC сборки из GenBank |
GCA_000337935.2 (latest) |
assembly level |
Scaffold |
Общая длина последовательности, п.о. |
1,108,534,737 |
Число контигов |
107,177 |
Число скэффолдов |
15,057 |
N50 для контигов |
26,627 |
L50 для контигов |
12,120 |
N50 для скэффолдов |
14,233,134 |
L50 для скэффолдов |
17 |
число аннотированных белков |
18,148 |
Ссылка на публикацию с описанием проекта |
PubMed |
Ссылка на последовательность одного из контигов в формате .fasta |
туть |
В отчете о сборке генома найдем строку WGS Project и нажмем на ссылку, ведущую проекту
полного геномного секвенирования. Ищем в записи WGS (в самом конце). Жмакаем на ссылку
и переносимся к списку контигов с ссылками на последовательности в формате .fasta (эти последовательности можно даже скачать).
Недолго раздумывая, возьмем первый попавшийся контиг в списке. Его название ScoHet5_20,
AC AKCR02000001.1, длина 94,473,889, ссылка на последовательность указана в талице.
Задание 2
Было дано задание найти последовательность CDS организма семейства вирусов-бактериофагов Inoviridae с длиной генома 6000-7000.
Откроем NCBI, в строке поиска набираем:
(Inoviridae[Organism] AND 6000:7000[Sequence Length]) AND "Complete Genome"
ищем Nucleotide в разделе Genomes и радуемся жизни: нам удовлетворяет 60 записей с геномами.
Выберем какой-нибудь из геномов. Пусть это будет фаг спироплазмы - Spiroplasma phage SVTS2.
AC нуклеотидной записи |
NC_001270 |
латинское название вида |
Spiroplasma phage SVTS2 |
TaxID |
93224 |
тип генома |
DNA, ss, кольцевой (подтверждение здесь) |
хозяин вируса |
Spiroplasma |
файл с кодирующими участками |
туть |
Задание 3
Ключ |
Описание |
Пример |
CDS |
указывает на белок-кодирующую последовательность |
![cds](/~spyro/term3/block2/pr7/cds.png) |
rep_origin |
указывает на ориджин репликации |
![rep_origin](/~spyro/term3/block2/pr7/rep_origin.png) |
protein_bind |
указывает на сайт ДНК-белкового соединения |
![protein_bind](/~spyro/term3/block2/pr7/protein_bind.png) |
tRNA |
указывает на зрелую тРНК |
![trna](/~spyro/term3/block2/pr7/trna.png) |
misc_structure |
указывает на последовательность, для которой существует информация о вторичной или третичной структуре |
![misc_structures](/~spyro/term3/block2/pr7/misc_structures.png) |
misc_recomb |
указывает на вставленные или удаленные при рекомбинации участки |
![misc_recomb.png](/~spyro/term3/block2/pr7/misc_recomb.png) |
old_sequence |
указывает, что на данном участке представленной последовательности пересматривется предыдущая версия |
![old_sequence](/~spyro/term3/block2/pr7/old_sequence.png) |