Банки нуклеотидных последовательностей

Главная страница
Сборка генома эукариотического организма

Организм Canis lupus familiaris (собака).



Всего есть 3 сборки генома, самая полная из которых (на хромосомном уровне) имеет три версии. Представлены три породы: боксер, пудель и бигль. Я выбрала последнюю версию этой сборки CanFam3.1 (боксера по кличке Таша).



Общее число проектов - 5: PRJNA13179, PRJNA176193, PRJNA10628, PRJNA13179 и PRJNA12384.Число образцов – 4: SAMN02953603, SAMN01737209, SAMN03004377, SAMN02953603.

Для сборки боксера:



Проект PRJNA13179 (ID: 13179)
Описание:
Геном секвенирован Dog Genome Sequencing Consortium во главе с Broad Institute. Геном с 7,6-кратным покрытием был получен с помощью WGS (whole genome shotgun). Образец взят у самки боксера. Порода была выбрана на основе анализа 60 пород собак, который показал, что эта боксер является одной из пород с наименьшим количеством изменений генома.




Образец SAMN02953603 (GenBank: gb|AAEX00000000.3)
В описании образца указана таксономия, пол и порода собаки. Также предлагаются два проекта, в которых используется этот образец.



Число контигов - 27,106.
Число скэффолдов - 3,310.

Всего два скэффолда: CM000001-CM000039 и JH373152-JH374193.
Таблицу контигов можно посмотреть здесь.
N50 = 267,478
L50 = 2,436

Самый длинный контиг 2,428,071
Самый короткий контиг 136 (его последовательность)

Митохондриальный геном мха

Вид мха - Sanionia uncinata (cаниония крючковатая).



По запросу (Sanionia uncinata[Organism]) AND mitochondrion[Title] в базе данных Nucleotide (NCBI) было найдено две записи: одна из NCBI, вторая из GenBank.

Число генов РНК - 3 рРНК и 24 тРНК.
Число генов белков – 40.

Список генов, отсортированный по началу в геноме.

Десять ключей, используемых в таблицах особенностей:

Ключ Описание Пример
mat_peptide Зрелый пептид или белок-кодирующая последовательность; продукт после пост-трансляционной модификации. 55..399
/gene="TCR1A"
mobile_element Область генома, содержащая мобильныеэлементы. /mobile_element_type="transposon:Tnp9"
operon Оперон. 160..6865
/operon="gal"
repeat_region Область генома, содержащая повторяющиеся единицы. 80..401
/rpt_type=DISPERSED
/rpt_family="Alu-J"
rep_origin Ориджин репликации. 6
/direction=LEFT
/note="ori"
sig_peptide Кодирующая последовательность сигнального пептида; последовательность, кодирующая N-концевой домен секретируемого белка. 1..54
/gene="TCR1A"
V_region Вариабельная область легкой и тяжелой цепи иммуноглобулина, и Т-клеточного рецептора альфа, бета и гамма цепи. 55..327
/gene="TCR1A"
J_segment Присоединенительный сегмент легкой и тяжелой цепи иммуноглобулина, и Т-клеточного рецептора альфа, бета и гамма цепи. 328..393
/gene="TCR1A"
source Источник; данный ключ является обязательным. 1..9430
/organism="Lactococcus sp."
/strain="MG1234"
/mol_type="genomic DNA"
unsure Автор не уверен в точности последовательности в данной области. 11..15
/replace=""

© Широковских Татьяна