Нуклеотидные банки данных
1. Характеристика качества сборки генома эукариотического организма
В качестве примера эукариотического организма был выбран Ficus carica (common fig) — инжир. Для данного организма существует только один образец и только одна сборка генома.
Таксономия: cellular organisms; Eukaryota; Viridiplantae; Streptophyta; Streptophytina; Embryophyta; Tracheophyta; Euphyllophyta; Spermatophyta; Magnoliophyta; Mesangiospermae; eudicotyledons; Gunneridae; Pentapetalae; rosids; fabids; Rosales; Moraceae; Ficus.
- Идентификатор образца: SAMD00051603
- Название образца: HO_leaves_1
- Дата поступления образца неизвестна
- Сорт: Ficus carica cultivar: Horaishi
- Среда обитания: выращен в открытом грунте
- Особенности среды обитания: неизвестны
- Образцы среды обитания: нет
- Образец находится в Японии, Fukuoka, Yukuhashi
- Плоидность: диплоидный организм
- Размножение: половое
- Ткань: зрелых листьев

|
 |
Cборка: GCA_002002945.1.
Образец участвовал в двух проектах по секвенированию организма (PRJDB4596 и PRJDB4615).
 |
- Код доступа к проекту: PRJDB4615.
- Идентификатор проекта: 369065.
- Название: Анализ последовательности ДНК листьев и стеблей инжира.
- Организм: Ficus carica (инжир обыкновенный).
- Идентификатор проекта: 369065.
- Тип данных: последовательность генома.
- Публикации: Mori K et al., "Identification of RAN1 orthologue associated with sex
determination through whole genome sequencing analysis in fig (Ficus
carica L.).", Sci Rep, 2017 Jan 25;7:41124
- Грант: "Horticulture Science" (Grant ID 23780037, Japanese Ministry of
Education , Culture, Sports, Science and Technology).
- Представлено: Дата регистрации 26-Jan-2017. Fruit Tree Team, Fukuoka Agriculture and Forestry Research
Center.
|
При сборке скаффорда образца SAMD00051603 использовались технологии Illumina GA2x; Illumina MiSeq; Illumina HiSeq2000.
- Полная длина последовательности 247,090,738
- Полная длина гэпов последовательности: 36,353,759
- Количество гэпов между скаффолдами: 0
- Количество скаффолдов: 27,995
- Количество контигов: 81,921
- Количество хромосом и плазмид: 0
- Ссылка на таблицу контигов и скэффолдов.
- Пример контига (fasta-файл).
- Самый длинный контиг: contig1 длина: 1764766
- Самый короткий контиг: contig27995 длина: 479
|
 |
2. Десять ключей, используемых в таблицах особенностей
Ключ |
Описание |
Пример использования |
db_xref= |
ссылка на объект в другой базе данных |
/direction=LEFT |
direction= |
направление репликации ДНК |
/db_xref="UniProtKB/Swiss-Prot:P28763" |
estimated_length= |
оценка длины гэпа |
/estimated_length=unknown /estimated_length=342 |
macronuclear |
макронуклеус |
/macronuclear |
plasmid= |
имя плазмиды, несущей данный участок ДНК |
/plasmid="C-589" |
sex= |
пол |
/sex="female" /sex="hermaphrodite" /sex="unisexual" /sex="bisexual" |
rep_origin |
ориджин репликации |
FEATURE Location/Qualifiers /rep_origin 3617..3892 /standard_name="ori1" /experiment="experimental evidence, no additional details recorded" /citation=[2] |
centromere |
центромера |
complement(26968..32592)
/locus_tag="TTRE_0000382201" |
CDS |
кодирующая последовательность |
FEATURE Location/Qualifiers
CDS join(544..589,688..>1032)
/product="T-cell receptor beta-chain" |
3. Состояние дел в одном из массовых геномных проектов
4. Таблица митохондриальных генов одного из организмов указаного таксона
Нужно было разобрать любой организм из царства Viridiplantae (Зеленые растения). Мы выбрали организм Chlorella variabilis.
Полные митохондриальные геномы таксона и число находок в GenBank и Refseq были найдены при помощи следующих запросов:
- (viridiplantae[ORGN] AND mitochondrion[TITLE] AND ("complete genome"[TITLE] OR "complete sequence"[TITLE])) AND srcdb_genbank[PROP]
Этот запрос дает 583 находки.
- (viridiplantae[ORGN] AND mitochondrion[TITLE] AND ("complete genome"[TITLE] OR "complete sequence"[TITLE])) AND srcdb_refseq[PROP]
Этот запрос дает 244 находки.
Таблица генов белков, закодированных в митохондриальном геноме.
© Екатерина Посицельская, 2015