Учебный Сайт Николая Николаева

Назад на страницу семестра

Нуклеотидные базы данных.

1. Описание сборки генома эукариотического организма.

Ananas comosus (Ананас хохлатый) - однодольное многолетнее тропическое травянистое растение из семейства Bromeliaceae, широко выращиваемое для употребления в пищу в ряде тропических и субтропических стран и являющееся в них одной из лидирующих культур. Наиболее экономически важная культура с CAM-метаболизмом в мире. Соплодие ананаса внешне напоминает сосновую шишку, что обусловило его английское название - "pineapple".

В NCBI Genome присутствуют 3 сборки генома организма. Была выбрана самая свежая из двух, имеющих хромосомный уровень - ASM154086v1.

Рис. 1. Розетка листьев и соплодие A. comosus (Взято с Wikimedia Commons, автор - Markus Leupold-Löwenthal).
Характеристика сборки:
  • RefSeq accession - GCF_001540865.1;
  • Уровень сборки - Хромосомный;
  • Общая длина - 382,055,938;
  • Контигов - 9,391;
  • Скэффолдов - 3,129;

  • N50 контигов - 114,399;
  • L50 контигов - 834;
  • N50 скэффолдов - 11,759,267;
  • L50 скэффолдов - 13.

2. Геномы прокариотических вирусов.

Текст запроса: (Pleolipoviridae[Organism]) AND 8000:9000[Sequence Length]. Число находок: 8.
Выбран геном вируса Halorubrum pleomorphic virus 3:
  • Accession: NC_017088;
  • Название вируса: Halorubrum pleomorphic virus 3 (TaxID: 1156720);
  • Геном: кольцевая дцДНК;
  • Хозяин вируса: архея Halorubrum sp. SP3-3 из Израиля;
Последовательности CDS в формате .fasta.
Файл получен с помощью функции "send to"; выбрана опция "coding sequences", формат "FASTA Nucleotides". Расширение загруженного файла сменено с ".txt" на ".fasta".

3. Некоторые ключи из таблицы локальных особенностей.

1. mobile_element - фрагмент генома, содержащий мобильные генетические элементы.
AJ131756:
     mobile_element  276..1043
                     /note="Insertion of IS1 in the csgB gene of avian E. coli
                     O78:K80, resulting in loss of phenotype associated with
                     curli fimbriae"
                     /mobile_element_type="insertion sequence:IS1"
2. regulatory - любой участок последовательности, принимающий участие в транскрипции, трансляции, репликации, рекомбинации или организации хроматина.
CP084677:
     regulatory      complement(594081..594211)
                     /regulatory_class="riboswitch"
                     /inference="COORDINATES: nucleotide
                     motif:Rfam:14.4:RF00050"
                     /inference="COORDINATES: profile:INFERNAL:1.1.1"
                     /note="FMN riboswitch; Derived by automated computational
                     analysis using gene prediction method: cmsearch."
                     /bound_moiety="flavin mononucleotide"
                     /db_xref="RFAM:RF00050"
3. modified_base - модифицированный нуклеотид. Должен быть заменён на указанный в mod_base.
NC_005859:
     modified_base   complement(29282)
                     /gene="tRNAQ1(UUG)"
                     /locus_tag="T5t05"
                     /mod_base=t
4. propeptide - последовательность, кодирующая пропептид - домен пропротеина, который должен быть вырезан для образования зрелого продукта.
LR994624:
    sig_peptide     1..63
                [...]
    propeptide      64..138
    mat_peptide     139..198
                [...]
5. mat_peptide - белковый продукт посттрансляционных модицикаций или последовательность, кодирующая зрелый пептид (без стоп-кодона, в отличие от CDS).
BS001245:
     mat_peptide     16236..18038
                     /gene="ORF1ab"
                     /product="helicase"
     mat_peptide     18039..19619
                     /gene="ORF1ab"
                     /product="3'-to-5' exonuclease"
     mat_peptide     19620..20657
                     /gene="ORF1ab"
                     /product="endoRNAse"
     mat_peptide     20658..21551
                     /gene="ORF1ab"
                     /product="2'-O-ribose methyltransferase"