Банки нуклеотидных последовательностей
Задание 1
На картинке - Varroa jacobsoni - один из видов эктопаразитических клещей, которые питаются гемолимфой китайских восковых, а с недавнего времени - и медоносных пчёл, что представляет некоторую опасность для колоний пчёл. Они обитают по всему миру, кроме Антарктиды, Австралии и центральной Африки. Долгое время в этот вид включали и более опасный Varroa destructor, пока в 2000 году на основании различий митохондриальной ДНК его не выделили в отдельний вид.
Число сборок | 1, она же лучшая |
Название | vjacob_1.0 |
AC | GCA_002532875.1 |
assembly level | Scaffold |
Длина последовательности | 365.586 Mb |
Число скэффолдов | 4,881 |
Scaffold N50 | 233,810 |
Scaffold L50 | 482 |
Число конигов | 8,241 |
Contig N50 | 96,009 |
Contig L50 | 1,168 |
Число аннотированных белков | В данной сборке не аннотированы |
Ссылка на публикацию с описанием проекта | Varroa jacobsoni isolate: VJ856 |
ССылка на последовательность одного из контигов в формате fasta. | Кликая на WGS, по этой ссылке можно попасть на список контигов. Скачен vj_3.fasta |
Задание 2
Здесь в базе данных по Nuleotides в NCBI с помощью "advanced search" проводился поиск геномов длины 30-40 килобаз семейства вирусов Podoviridae. Строка поиска - " ((Podoviridae[Organism]) AND 30000:40000[Sequence Length]) AND "Complete Genome" ". В GenBank было найдено 229 геномов, в RefSeq - 78. После этого был выбран один геном Escherichia phage EG1. Кодирующие последовательности были скачены со страницы генома (Send to с галочкой на Coding Sequences). Результаты представлены в таблице ниже.
Латинское название и TaxID вида | Escherichia phage EG1, 2053563 |
AC | MG488277.1 |
Тип генома | linear dsDNA |
Хозяина вируса | Escherichia coli str. K-12 substr. MG1655 |
Ссылка на fasta файл, предположительно с CDS | Escherichia phage EG1_CDS.fasta |
Задание 3
Требовалось описать 7 любых ключей, использующихся в feature table и привести примеры их использования. Предпочтение отдавалось неизвестным и интересным ключам. Информация о ключах взята с NCBI, а примеры получены с помощью "advanced search" по вводу ("Key"[Feature key]) AND 1000:20000[Sequence Length].
D-loop 15436..16362 /gene="D-loop" От Displacement loop - "петля смещения". Участок митохондриальной ДНК, который взаимодействует с участком ДНК, вытесняя комплиметарную цепь и образуя петлеобразную структуру. STS 395..916 /standard_name="D10Bir17" STS - Sequence Tagged Site - короткая одноцепочечная последовательность ДНК, которая может быть использована для идентификации с помощью ПЦР misc_RNA 1..1391 /gene="LOC116094409" /product="elongation factor 1-gamma pseudogene" /pseudo /db_xref="GeneID:116094409" misc_RNA - любой транскрипт или продукт РНК, который нельзя определить другими ключами (prim_transcript, precursor_RNA, mRNA, 5'UTR, 3'UTR, exon, transit_peptide, polyA_site, rRNA, tRNA, and ncRNA) misc_binding complement(13495..13701) /inference="COORDINATES: nucleotide motif:Rfam:12.0:RF00230" /inference="COORDINATES: profile:INFERNAL:1.1.1" /note="T-box leader; Derived by automated computational analysis using gene prediction method: cmsearch." /bound_moiety="tRNA" /db_xref="RFAM:RF00230" misc_binding - сайт нуклеионовой кислоты, которая ковалентно или нековалентно связывается с другим фрагментом, который не может быть описан другим ключом, говорящем об участке связывания (primer_bind or protein_bind) primer_bind complement(932..951) /note="reverse_primer" primer_bind - нековалентный участок связывания праймера для инициации транскрипции, репликации или обратной транскрипции. variation 758..764 /gene="Arsb" /replace="cccccccc" variation - в родственной цепочке есть стабильные мутации в том же гене, например, полиморфизмы. J_segment 1..61 /gene="TARP" /gene_synonym="CD3G; TCRG; TCRGC1; TCRGC2; TCRGV" /note="J segment TRGJP" J_segment - соединительный пептид тяжёлой и лёгкой цепей иммуноглобулина или цепей альфа, бета и гамма рецептора Т-клеток