Банки нуклеотидных последовательностей

1.Характеристика качества сборки генома эукариотического организма

Для этого задания я выбрала организм Malus domestica (яблоня домашняя) сорта Golden Delicious.

  • Cборки генома:
  • Проекты:
      PRJNA28845 - секвенирование полного генома (WGS) яблони Malus domestica сорта Golden Delicious.
      PRJNA249071 - определение эталонной последовательности генома Malus domestica по последовательности в GenBank.
  • Образцы:
      SAMN02981243 - образец, полученный из молодых листьев яблони сорта Golden Delicious.
  • Число скэффолдов: 1,667
  • Число контигов: 106,204
  • Список скэффолдов
  • Таблица контигов
  • N50 - 12,414
  • L50 - 14,506
  • Самый длинный контиг - 154879
  • Самый короткий контиг - 100
  • Ссылка на последовательность произвольного контига - ACYM01074382
  • 2.Опиcание десяти ключей, используемых в таблицах особенностей

    КлючОписаниеПример
    1CDS Кодирующая последовательность
         CDS             167743..167955
                         /locus_tag="CRDC_01025"
                         /codon_start=1
                         /transl_table=11
                         /product="hypothetical protein"
                         /protein_id="AGS06689.1"
                         /translation="MDLLKVNIFFFNYFIMKKEKICNKTKKNLTKNLLIFKKMYYLYY
                         LKMINRKKFFISKKFTIRINCKLICC"
    2gene Ген
         gene            170962..171711
                         /gene="dapF" 
    3mRNAМатричная РНК
         mRNA            complement(<16784..>18553)
                         /gene="IMA3"
                         /locus_tag="YIL172C"
                         /product="oligo-1,6-glucosidase IMA3"
                         /transcript_id="NM_001179518.1"
                         /db_xref="GeneID:854635"
    4rep_originСтартовый сайт для репликации
         rep_origin      136098..136338
                         /note="ARS911;
                         Autonomously Replicating Sequence"
                         /db_xref="SGD:S000118395"
    5tRNAЗрелая тРНК
         tRNA            5136..5205
                         /product="tRNA-Trp"
                         /note="codon recognized: UGA"
                         /anticodon=(pos:5167..5169,aa:Trp,seq:tca)
    6D-loopD-петля тРНК
         D-loop          15715..16825
    7repeat_regionУчасток, содержащий повторяющиеся фрагменты
         repeat_region   324831..325164
                         /note="Ty1 LTR"
                         /rpt_type=long_terminal_repeat
                         /db_xref="SGD:S000007016"
    8centromereЦентромера хромосомы
         centromere      355629..355745
                         /note="CEN9; Chromosome IX centromere"
                         /db_xref="SGD:S000006470"
    9intronИнтрон
         intron          complement(86211..87265)
                         /gene="rpl16"
                         /locus_tag="HZ11_p028"
                         /number=1
    10misc_featureНовая или редкая особенность, не описываемая другими ключами
         misc_feature    34722..34750
                         /note="tip of inverted repeats; Region: loop sequence"

    3. Cостояние дел в одном из массовых геномных проектов

    Название проекта I5k initiative (arthropods)
    Цель Секвенировать 5,000 геномов 50 насекомых и родственных им членистоногих, для лучшего понимания их эволюции и филогении
    Дата начала 9 мая 2012
    Ссылка на страницу i5k initiative
    Организация i5k Consortium
    Страна США
    Планируемое число геномов 5,000
    Кол-во образцов на 2016 год 139
    Кол-во секвенированных геномов на 2016 год 33
    Последняя публикация по проекту PubMed
    Дата завершения В далеком будущем
    4. Таблица митохондриальных генов одного из организмов указаного таксона

    Мне достался таксон Rhizaria. Я нашла все полные митохондриальные геномы этого таксона с помощью такого запроса:
    "Rhizaria"[Organism] AND ("complete genome"[TITLE] OR "complete sequence"[TITLE]) AND (mitochondrion[TITLE])
    Нашлось 5 записей: 3 в GenBank и 2 в Refseq, причем записи в Refseq повторяли 2 записи в GenBank, то есть по факту, нашлось всего 3 митохондриальных генома. Я взяла организм Lotharella oceanica штамма CCMP622 (на рисунке справа). О его геноме 2 записи: в GenBank и в Refseq.

    Таблица митохондриальных генов Lotharella oceanica

    Сначала я хотела взять Spongospora subterranea, так как он, на мой взгляд, интереснее, но в БД не оказалось его генов.

    5. Размеры геномов

    Взято отсюда: Genome list

    ВироидыВирусы, бактериофагиБактерии, археиЭукариоты
    Минимальный246220104827662517
    Типичный30010000500000015000000
    Максимальный43424738702514260027602700000


    © Герасева Е.П. 2015