Банк нуклеотидных последовательностей EMBL

  1. Некоторые сведения, полученные при помощи системы SRS (http://srs.ebi.ac.uk/)

    1. Дата последнего проиндексированного в системе релиза EMBL: 07-Sep-2009
      Количество записей в EMBL: 108577013

    2. Список классов банка EMBL
      • ANN: Constructed sequence with annotation
      • CON: Constructed sequence
      • EST: Expressed Sequence Tag
      • GRV: Genome Reviews
      • GSS: Genome Survey Sequence
      • HTC: High Throughput cDNA sequencing
      • HTG: High Throughput Genome sequencing
      • MGA: Mass Genome Annotation
      • PAT: Patent
      • SET: Project set (EMBL WGS Masters only)
      • STD: Standard
      • STS: Sequence Tagged Site
      • TPA: Third Party Annotation
      • TSA: Transcriptome Shotgun Assembly
      • WGS: Whole Genome Shotgun


      Проиндексированы записи следующих классов:
      • EST: 62846990
      • GSS: 25905073
      • HTC: 549753
      • HTG: 142473
      • PAT: 10439165
      • STD: 7253026
      • STS: 1310171
      • TPA: 6520
      • TSA: 123842


      Не проиндексированы записи:
      • ANN: Constructed sequence with annotation
      • CON: Constructed sequence
      • GRV: Genome Reviews
      • MGA: Mass Genome Annotation
      • SET: Project set
      • WGS: Whole Genome Shotgun

    3. Список разделов банка EMBL:
      Обозначение Описание Число записей
      по-английски по-русски
      ENV Environmental Samples Образцы из окружающей среды 4145029
      FUN Fungi Грибы 3942084
      HUM Human Человек 12841544
      INV Invertebrates Беспозвоночные 15518735
      MAM Other Mammals Другие млекопитающие 9429823
      MUS Mus musculus Домовая мышь 7424621
      PHG Bacteriophage Бактериофаги 5865
      PLN Plants Растения 33806044
      PRO Prokaryotes Прокариоты 909986
      ROD Rodents Грызуны 2261678
      SYN Synthetic Синтетические 2671622
      TGN Transgenic Трансгенные 265465
      UNC Unclassified Неклассифицированные 3945859
      VRL Viruses Вирусы 827405
      VRT Other Vertebrates Другие позвоночные 10581253

  2. Информация о гене FB19 из записи BA000025:

    направление гена относительно направления,
    выбранного для записи
    прямое
    число кодирующих участков18
    длины первого кодирующего участка107
    длина последнего кодирующего участка110
    длина первого интрона между кодирующими участками674
    длина последнего интрона между кодирующими участками  277
  3. Поиск белка по кодирующему участку

    При помощи программы seqret был вырезан участок, это 1337941..1338187, в файл big_exon_fb19.fasta. Чтобы найти в Swiss-Prot соответствующий белок, я выбрал программу BLASTX. На вход программе я дал вырезанный участок и прогнал по базе Swiss-Prot. На выходе программа выдала около 6 белков с E < * e-15. Последний, sp|Q96QC0.1|PP1RA_HUMAN, это и есть описаный FB19 в записи BA000025.
  4. Характеристика записей EMBL, на которые ссылается запись P63284 банка SwissProt

    Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Описание Длина
    M29364 genomic DNA STD PRO 01-FEB-1991 Escherichia coli ATP-dependent protease binding subunit gene, complete cds 4240
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675
    AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome. 4646332
    X57620 genomic DNA STD PRO 08-AUG-1991 E.coli ClpB gene for an analogue of ATP-dependent protease regulatory subunit 3503
    V00350 genomic DNA STD PRO 03-NOV-1982 Start of the E. coli gene for 16S rRNA. Also contains part of unknown reading frame. 1436
    U50134 genomic DNA STD PRO 27-MAR-1996 Escherichia coli ftsH suppressor protein (sfhB) gene and (yfiH) gene, complete cds, and clpB gene, partial cds. 2193