Нуклеотидные банки данных

Задание 1
Описание сборки генома эукариотического организма

Кабан (Sus scrofa) - парнокопытное млекопитающее, относится к семейству свиней. Всеядны, преимущественно питаются растительностью, реже мелкими животными и падалью.

https://www.ncbi.nlm.nih.gov/assembly/GCA_000181335.5


число сборок генома 23
название (assembly name) Ninghe_Sus_1
AC GCA_015776825.1
уровень сборки (assembly level) Chromosome
общая длина последовательности 2,458,240,772
число контигов 1,660
число скэффолдов 70
N50 контигов 4,265,198
N50 скэффолдов 137,575,542
L50 контигов 187
L50 скэффолдов 7
последовательность одного из контигов тут

Задание 2

Запрос: 4000:5000[Sequence Length] AND Inoviridae[Organism] AND complete genome.
Количество находок: 26. (25 - GenBank, 1 - RefSeq)

АС MT135312
Таксономия Inovirus sp. Viruses; Monodnaviria; Loebvirae; Hofneiviricota; Faserviricetes; Tubulavirales; Inoviridae; Inovirus; unclassified Inovirus.
латинское название Inovirus sp.
TaxID 2202560
тип генома Circular, ssDNA genome
хозяина вируса Не указано
файл с участками генома, предположительно кодирующими белки (CDS) тут

Получение файла: Send to -> Coding Sequences -> Format: Fasta Nucleotide

Задание 3

rep_origin - ориджин репликации. Сайт инициирующий дублирование нуклеиновой кислоты, чтобы создать две идентичные копии. То есть точка начала репликации.
AC - NC_009492

D-loop - петля смещения. Область внутри митохондриальной ДНК, в которой короткий участок РНК взаимодействует с одной цепью ДНК, смещая исходную комлементарную цепочку ДНК в этой области. Также используется для описания смещения область одной цепи дуплекса ДНК на другую цепь в реакции, катализируемой белком RecA.
AC - MW257206

misc_feature - новый или редкий участок, который не попадет под описание какого-либо ключа.
AC - MN885913

mobile_element - область генома, содержащая подвижные(мобильные) элементы.
AC - EU350953

repeat_region -область генома, содержащая повторяющиеся фрагменты.
AC - AC005703