Банки нуклеотидных последовательностей. Батыр

Третий семестр Главный сайт



Задание 1

Для рассмотрения я взял дрозофилу обыкновенную Drosophila melanogaster. В базе данных NCBI/Genome было найдено 4 сборки 
(и одна сборка митохондриального генома), из которых лишь одна была хромосомного масштаба. Всего в базе данных значится 11 работ по 
секвенированию генома дрозофилы, включая митохондриальный. Использовалась сборка ASM77845v1. Образцом для нее был эмбрион 
дрозофилы линии iso-1.
					
Таблица 1. Информация о сборке ASM77845v1.
GenBank assembly accession GCA_000778455.1
Общая длина последовательности 164,080,454
Число контигов 789
N50 для контигов 13,636,574
L50 для контигов 4
Общее число хромосом и плазмид 8

   Данные о образце: 
Скэффолдов всего 789, т.к. сборка на уровне контигов, и каждый контиг - скэффолд.
Таблица контигов
Cамый длинный контиг - 25,793,534, самый короткий - 8,169
Один из контигов (JSAE01000459)

Задание 2. Митохондриальный геном мха Climacium americanum

Запрос был сформулирован так: "Climacium americanum"[Organism] AND mitochondrion[filter]  . 
Результатом стало 2 записи одного и того же проекта, одна в NCBI RefSeq, другая в GenBank.
Данные по генам:
Список генов, отсортированный по началу в геноме по убыванию

Задание 3.

Ключ (Feature Key )ОписаниеПример
STSsequence tagged site; короткая неповторяющаяся последовательность, используемая для картирования генома STS 1905..2059
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2; p493F12; p54bSAPK; SAPK(beta); Serk2"
/db_xref="UniSTS:224677"
polyA_siteОбласть гена, которая во время процессинга РНК полиаденилируется.2792
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2; p493F12; p54bSAPK; SAPK(beta); Serk2"
regulatoryЛюбая последовательность, участвующая в регуляции транскрипции или трансляции2757..2762
/regulatory_class="polyA_signal_sequence"
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2; p493F12; p54bSAPK; SAPK(beta); Serk2"
misc_featureОтстутствующий в каталоге феномен. Редкость или нечто новое.540..542
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2; p493F12; p54bSAPK; SAPK(beta); Serk2"
/note="upstream in-frame stop codon"
exonЭкзон. Кодирующий участок.561..632
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2; p493F12; p54bSAPK; SAPK(beta); Serk2"
/inference="alignment:Splign:1.39.8"
misc_binding Область в геноме, c которой связываются не праймеры и не белки (для них отдельные обозначения).2246811..2247004
/note="cobalamin riboswitch; Derived by automated computational analysis using gene prediction method: cmsearch."
/bound_moiety="adenosylcobalamin"
modified_baseМодифицированное основание complement(6658)
/note="modified D-C residue"
/mod_base=OTHER
ncRNAГен, кодирующий РНК, неявляющуюся мРНК, тРНК или рРНКcomplement(33881..34221)
/ncRNA_class="RNase_P_RNA"
/locus_tag="ASL20_RS18900"
/product="bacterial RNase P"
/note="Derived by automated computational analysis using gene prediction method: cmsearch."
rep_originМесто, где начинается репликация.complement(3548..4148)
/note="colE1 ori"
/direction=LEFT
=======================================================

Сайт находится в стадии разработки


© 2014 Рюмин Константин