Знакомство со структурой банка EMBL посредством поисковой системы SRS

  • Текущий релиз (109) имеет 71833235 последовательностей и индексирован 08-Sep-2011.

  • Список классов (Непроиндексированы те классы, у которых справа нет числа):
        CON: Constructed sequence
        EST: Expressed Sequence Tag
        GRV: Genome Reviews
        GSS: Genome Survey Sequence             	32578894
        HTC: High Throughput cDNA sequencing        533398
        HTG: High Throughput Genome sequencing      145701
        MGA: Mass Genome Annotation
        PAT: Patent                                 22346593
        SET: Project set (EMBL WGS Masters only)
        STD: Standard                               11737741
        STS: Sequence Tagged Site                   1322285
        TSA: Transcriptome Shotgun Assembly         3168623
        WGS: Whole Genome Shotgun
    
  • Подразделения (Division) в EMBL и их число в последнем релизе:
        ENV: Образцы окружающей среды         6637887 
        FUN: Грибы                            2219095 
        HUM: Человек                          10687844
        INV: Беспозвоночные                   5906093 
        MAM: Другие млекопитающие             5765536 
        MUS: Мышь                             4779883 
        PHG: Бактериофаги                     8082    
        PLN: Растения                         17132180
        PRO: Прокариоты                       1467025 
        ROD: Грызуны                          1265394 
        SYN: Синтетические конструкции        3632878 
        TGN: Трансгенные образцы              265545  
        UNC: Неклассифицированные             7500493 
        VRL: Вирусы                           1177936 
        VRT: Другие позвоночные               3387364 
    
  • Дополниетльно*
    xlsx- ФАЙЛ с диаграммой
  • Описание гена в записи банка EMBL
    Ген находится в комплементарной цепи, что значит что направление обратное.
    Число кодирующих участков (экзонов):5
    Длина первого из них: 128
    Последнего: 256
    Длина 1-го интрона: 2568
    Последнего: 266
  • Нахождение белка по фрагменту гена

  • 1. Сначала выбираем самый длинный участок
    2. Затем командой
     seqret embl:BA000025 -sask
    "вытаскиваем" этот фрагмент
    3. После, программой BLASTx ищем наш белок.
    Найдено много протеинов с идентичностью 65% и меньше
    Протеин MHC class I polypeptide-related sequence A,
    соответствует моему экзону на участке с 243 по 294 остаткок.


  • Ссылки из записи банка Swiss-Prot на записи банка EMBL

  • Ссылки:
    DR   EMBL; M59757; AAA21273.1; -; Genomic_DNA.
    DR   EMBL; AL009126; CAB13429.1; -; Genomic_DNA.