Go back

Банки нуклеотидных последовательностей

Задание 1

На картинке - Varroa jacobsoni - один из видов эктопаразитических клещей, которые питаются гемолимфой китайских восковых, а с недавнего времени - и медоносных пчёл, что представляет некоторую опасность для колоний пчёл. Они обитают по всему миру, кроме Антарктиды, Австралии и центральной Африки. Долгое время в этот вид включали и более опасный Varroa destructor, пока в 2000 году на основании различий митохондриальной ДНК его не выделили в отдельний вид.

Something went wrong :(
 Рис.1 Varroa jacobsoni
Ссылка на источник
Число сборок 1, она же лучшая
Название vjacob_1.0
AC GCA_002532875.1
assembly level Scaffold
Длина последовательности 365.586 Mb
Число скэффолдов 4,881
Scaffold N50 233,810
Scaffold L50 482
Число конигов 8,241
Contig N50 96,009
Contig L50 1,168
Число аннотированных белков В данной сборке не аннотированы
Ссылка на публикацию с описанием проекта Varroa jacobsoni isolate: VJ856
ССылка на последовательность одного из контигов в формате fasta. Кликая на WGS, по этой ссылке можно попасть на список контигов. Скачен vj_3.fasta

Задание 2

Здесь в базе данных по Nuleotides в NCBI с помощью "advanced search" проводился поиск геномов длины 30-40 килобаз семейства вирусов Podoviridae. Строка поиска - " ((Podoviridae[Organism]) AND 30000:40000[Sequence Length]) AND "Complete Genome" ". В GenBank было найдено 229 геномов, в RefSeq - 78. После этого был выбран один геном Escherichia phage EG1. Кодирующие последовательности были скачены со страницы генома (Send to с галочкой на Coding Sequences). Результаты представлены в таблице ниже.

Латинское название и TaxID вида Escherichia phage EG1, 2053563
AC MG488277.1
Тип генома linear dsDNA
Хозяина вируса Escherichia coli str. K-12 substr. MG1655
Ссылка на fasta файл, предположительно с CDS Escherichia phage EG1_CDS.fasta

Задание 3

Требовалось описать 7 любых ключей, использующихся в feature table и привести примеры их использования. Предпочтение отдавалось неизвестным и интересным ключам. Информация о ключах взята с NCBI, а примеры получены с помощью "advanced search" по вводу ("Key"[Feature key]) AND 1000:20000[Sequence Length].

	D-loop		15436..16362 
	                /gene="D-loop"
	                От Displacement loop - "петля смещения". Участок митохондриальной ДНК, который взаимодействует с участком ДНК, вытесняя комплиметарную цепь и образуя петлеобразную структуру.
	STS             395..916
                    	/standard_name="D10Bir17"
                    	STS - Sequence Tagged Site - короткая одноцепочечная  последовательность ДНК, которая может быть использована для идентификации с помощью ПЦР
	misc_RNA        1..1391
                    	/gene="LOC116094409"
                    	/product="elongation factor 1-gamma pseudogene"
                    	/pseudo 
                    	/db_xref="GeneID:116094409"
                    	misc_RNA - любой транскрипт или продукт РНК, который нельзя определить другими ключами (prim_transcript, precursor_RNA, mRNA, 5'UTR, 3'UTR, exon, transit_peptide, polyA_site, rRNA, tRNA, and ncRNA)
	misc_binding    complement(13495..13701)
                    	/inference="COORDINATES: nucleotide
                    	motif:Rfam:12.0:RF00230"
                    	/inference="COORDINATES: profile:INFERNAL:1.1.1"
                    	/note="T-box leader; Derived by automated computational
                    	analysis using gene prediction method: cmsearch."
                    	/bound_moiety="tRNA"
                    	/db_xref="RFAM:RF00230"
                    	misc_binding - сайт нуклеионовой кислоты, которая ковалентно или нековалентно связывается с другим фрагментом, который не может быть описан другим ключом, говорящем об участке связывания (primer_bind or protein_bind)
	primer_bind     complement(932..951)
                    	/note="reverse_primer"
                     	primer_bind - нековалентный участок связывания праймера для инициации транскрипции, репликации или обратной транскрипции.
	variation       758..764
                    	/gene="Arsb"
                    	/replace="cccccccc"
                    	variation - в родственной цепочке есть стабильные мутации в том же гене, например, полиморфизмы.
	J_segment       1..61
                    	/gene="TARP"
                    	/gene_synonym="CD3G; TCRG; TCRGC1; TCRGC2; TCRGV"
                    	/note="J segment TRGJP"
                    	J_segment - соединительный пептид тяжёлой и лёгкой цепей иммуноглобулина или цепей альфа, бета и гамма рецептора Т-клеток