Третий семестр
Главный сайт
|
Задание 1
Для рассмотрения я взял дрозофилу обыкновенную Drosophila melanogaster. В базе данных NCBI/Genome было найдено 4 сборки
(и одна сборка митохондриального генома), из которых лишь одна была хромосомного масштаба. Всего в базе данных значится 11 работ по
секвенированию генома дрозофилы, включая митохондриальный. Использовалась сборка ASM77845v1. Образцом для нее был эмбрион
дрозофилы линии iso-1.
Таблица 1. Информация о сборке ASM77845v1.
|
GenBank assembly accession |
GCA_000778455.1 |
Общая длина последовательности |
164,080,454 |
Число контигов |
789 |
N50 для контигов |
13,636,574 |
L50 для контигов |
4 |
Общее число хромосом и плазмид |
8 |
Данные о образце:
Скэффолдов всего 789, т.к. сборка на уровне контигов, и каждый контиг - скэффолд.
Таблица контигов
Cамый длинный контиг - 25,793,534, самый короткий - 8,169
Один из контигов (JSAE01000459)
Задание 2. Митохондриальный геном мха Climacium americanum
Запрос был сформулирован так: "Climacium americanum"[Organism] AND mitochondrion[filter] .
Результатом стало 2 записи одного и того же проекта, одна в NCBI RefSeq, другая в GenBank.
Данные по генам:
Список генов, отсортированный по началу в геноме по убыванию
Задание 3.
Ключ (Feature Key ) | Описание | Пример |
STS | sequence tagged site; короткая неповторяющаяся последовательность, используемая для картирования генома |
STS 1905..2059
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2;
p493F12; p54bSAPK; SAPK(beta); Serk2"
/db_xref="UniSTS:224677"
|
polyA_site | Область гена, которая во время процессинга РНК полиаденилируется. | 2792
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2;
p493F12; p54bSAPK; SAPK(beta); Serk2"
| regulatory | Любая последовательность, участвующая в регуляции транскрипции или трансляции | 2757..2762
/regulatory_class="polyA_signal_sequence"
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2;
p493F12; p54bSAPK; SAPK(beta); Serk2" |
misc_feature | Отстутствующий в каталоге феномен. Редкость или нечто новое. | 540..542
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2;
p493F12; p54bSAPK; SAPK(beta); Serk2"
/note="upstream in-frame stop codon" |
exon | Экзон. Кодирующий участок. | 561..632
/gene="Mapk10"
/gene_synonym="C230008H04Rik; JNK3; JNK3B1; JNK3B2;
p493F12; p54bSAPK; SAPK(beta); Serk2"
/inference="alignment:Splign:1.39.8" |
misc_binding | Область в геноме, c которой связываются не праймеры и не белки (для них отдельные обозначения). | 2246811..2247004
/note="cobalamin riboswitch; Derived by automated
computational analysis using gene prediction method:
cmsearch."
/bound_moiety="adenosylcobalamin" |
modified_base | Модифицированное основание |
complement(6658)
/note="modified D-C residue"
/mod_base=OTHER |
ncRNA | Ген, кодирующий РНК, неявляющуюся мРНК, тРНК или рРНК | complement(33881..34221)
/ncRNA_class="RNase_P_RNA"
/locus_tag="ASL20_RS18900"
/product="bacterial RNase P"
/note="Derived by automated computational analysis using
gene prediction method: cmsearch." |
rep_origin | Место, где начинается репликация. | complement(3548..4148)
/note="colE1 ori"
/direction=LEFT |
=======================================================
|