Учебный сайт Корляковой Марии

Работа с нуклеотидными базами данных

Сборка генома Hirundo rustica

Деревенская ласточка (Hirundo rustica). Фотография freepik.com

Деревенская ласточка (Hirundo rustica) является одним из самых распространенных видов среди воробьинообразных. Деревенские ласточки встречаются в Европе, Азии, Африке и Америке, являются перелетными птицами. Всего насчитывают около шести подвидов. Деревенская ласточка часто упоминается в литературе и является символом свободы и прихода весны.

Таблица 1. Информация о выбранной сборке генома Hirundo rustica

Общее количество сборок генома 4
Выбранная сборка bHirRus1.pri.v2
AC (RefSeq) GCF_015227805.1
Assembly level Хромосомный
Общая длина 1105.95 Mb (1,105,955,550 bp)
Число контигов 1719
(N50, L50) контигов 2,794,774 ; 100
Число скэффолдов 617
(N50, L50) скэффолдов 76,187,387; 5
BioProject (ссылка на публикацию) PRJNA636192
Последовательность контига JADDRP020000036.1 ссылка

CDS представителя Myoviridae

Запрос: Myoviridae[orgn] and 30000:40000[slen] and COMPLETE GENOME
Количество находок: 2453

Таблица 2. Информация о геноме вируса Burkholderia phage phiE12-2

AC записи NC_009236
Организм Burkholderia phage phiE12-2
Таксономия Viruses; Duplodnaviria; Heunggongvirae; Uroviricota; Caudoviricetes; Caudovirales; Myoviridae; Peduovirinae; Tigrvirus.
Тип генома Линейная двуцепочечная ДНК
TaxID 2881401
Хозяин Burkholderia pseudomallei
Файл с CDS белков ссылка

Как был получен файл с CDS: Send to - Coding Sequences - Download features. FASTA Nucleotide.

Ключи локальных особенностей

misc_RNA любой транскрипт или продукт РНК, который не относится к другим ключам РНК (таким как: prim_transcript, precursor_RNA, mRNA, 5'UTR, 3'UTR, exon, CDS, sig_peptide, transit_peptide, mat_peptide, intron, polyA_site, ncRNA, rRNA and tRNA).

AC: NC_031940.1

ncRNA ген, не кодирующий белок, отличный от рибосомной и транспортной РНК, функциональной молекулой которого является РНК-транскрипт.

AC: NC_000002.12

sig_peptide последовательность, кодирующая сигнальный пептид; кодирующая последовательность для N-концевого домена секретируемого белка, этот домен участвует в присоединении зарождающегося полипептида к лидерной последовательности мембраны.

AC: NC_000002.12

mat_peptide кодирующая последовательность зрелого пептида или белка.

AC: NC_000002.12

transit_peptide последовательность, кодирующая транзитный пептид; участвует в посттрансляционном импорте белка в органеллу.

AC: NC_000002.12