На главную

Нуклеотидные банки данных

1. Характеристика качества сборки генома эукариотического организма

В качестве примера эукариотического организма был выбран Ficus carica (common fig) — инжир. Для данного организма существует только один образец и только одна сборка генома.

Таксономия: cellular organisms; Eukaryota; Viridiplantae; Streptophyta; Streptophytina; Embryophyta; Tracheophyta; Euphyllophyta; Spermatophyta; Magnoliophyta; Mesangiospermae; eudicotyledons; Gunneridae; Pentapetalae; rosids; fabids; Rosales; Moraceae; Ficus.

  • Идентификатор образца: SAMD00051603
  • Название образца: HO_leaves_1
  • Дата поступления образца неизвестна
  • Сорт: Ficus carica cultivar: Horaishi
  • Среда обитания: выращен в открытом грунте
  • Особенности среды обитания: неизвестны
  • Образцы среды обитания: нет
  • Образец находится в Японии, Fukuoka, Yukuhashi
  • Плоидность: диплоидный организм
  • Размножение: половое
  • Ткань: зрелых листьев

  • Cборка: GCA_002002945.1.
  • Образец участвовал в двух проектах по секвенированию организма (PRJDB4596 и PRJDB4615).
    • Код доступа к проекту: PRJDB4615.
    • Идентификатор проекта: 369065.
    • Название: Анализ последовательности ДНК листьев и стеблей инжира.
    • Организм: Ficus carica (инжир обыкновенный).
    • Идентификатор проекта: 369065.
    • Тип данных: последовательность генома.
    • Публикации: Mori K et al., "Identification of RAN1 orthologue associated with sex determination through whole genome sequencing analysis in fig (Ficus carica L.).", Sci Rep, 2017 Jan 25;7:41124
    • Грант: "Horticulture Science" (Grant ID 23780037, Japanese Ministry of Education , Culture, Sports, Science and Technology).
    • Представлено: Дата регистрации 26-­Jan-­2017. Fruit Tree Team, Fukuoka Agriculture and Forestry Research Center.

    При сборке скаффорда образца SAMD00051603 использовались технологии Illumina GA2x; Illumina MiSeq; Illumina HiSeq2000.

    • Полная длина последовательности 247,090,738
    • Полная длина гэпов последовательности: 36,353,759
    • Количество гэпов между скаффолдами: 0
    • Количество скаффолдов: 27,995
    • Количество контигов: 81,921
    • Количество хромосом и плазмид: 0
    • Ссылка на таблицу контигов и скэффолдов.
    • Пример контига (fasta-файл).
    • Самый длинный контиг: contig1 длина: 1764766
    • Самый короткий контиг: contig27995 длина: 479

    2. Десять ключей, используемых в таблицах особенностей

    Ключ Описание Пример использования
    db_xref= ссылка на объект в другой базе данных /direction=LEFT
    direction= направление репликации ДНК /db_xref="UniProtKB/Swiss-Prot:P28763"
    estimated_length= оценка длины гэпа /estimated_length=unknown
    /estimated_length=342
    macronuclear макронуклеус /macronuclear
    plasmid= имя плазмиды, несущей данный участок ДНК /plasmid="C-589"
    sex= пол /sex="female"
    /sex="hermaphrodite"
    /sex="unisexual"
    /sex="bisexual"
    rep_origin ориджин репликации FEATURE Location/Qualifiers
    /rep_origin 3617..3892
    /standard_name="ori1"
    /experiment="experimental evidence, no additional details recorded"
    /citation=[2]
    centromere центромера complement(26968..32592)
    /locus_tag="TTRE_0000382201"
    CDS кодирующая последовательность FEATURE Location/Qualifiers
    CDS join(544..589,688..>1032)
    /product="T-cell receptor beta-chain"

    3. Состояние дел в одном из массовых геномных проектов

    4. Таблица митохондриальных генов одного из организмов указаного таксона

    Нужно было разобрать любой организм из царства Viridiplantae (Зеленые растения). Мы выбрали организм Chlorella variabilis.

    Полные митохондриальные геномы таксона и число находок в GenBank и Refseq были найдены при помощи следующих запросов:

    Таблица генов белков, закодированных в митохондриальном геноме.


    © Екатерина Посицельская, 2015