Учебный сайт Смирновой Виктории

Главная Проекты Семестры


Банк нуклеотидных последовательностей EMBL


  1.  Использование системы SRS.
    1. Дата последнего проиндексированного в системе релиза EMBL 07-Sep-2009, количество записей в нём - 108577013.

    2. Список классов ("Data Class") банка EMBL и число записей каждого класса, проиндексированных SRS для последнего релиза EMBL:
      • ANN: Constructed sequence with annotation - не проиндексирован
      • CON: Constructed sequence - не проиндексирован
      • EST: Expressed Sequence Tag - 62846990
      • GRV: Genome Reviews - не проиндексирован
      • GSS: Genome Survey Sequence - 25905073
      • HTC: High Throughput cDNA sequencing - 549753
      • HTG: High Throughput Genome sequencing - 142473
      • MGA: Mass Genome Annotation - не проиндексирован
      • PAT: Patent - 10439165
      • SET: Project set (EMBL WGS Masters only) - не проиндексирован
      • STD: Standard - 7253026
      • STS: Sequence Tagged Site - 1310171
      • TPA: Third Party Annotation - 6520
      • TSA: Transcriptome Shotgun Assembly - 123842
      • WGS: Whole Genome Shotgun - не проиндексирован

    3. Список и описание разделов ("Divisions") банка EMBL и число записей в последнем релизе.
      • ENV: Образцы из окружающей среды - 4145029
      • FUN: Грибы - 3942084
      • HUM: Человек - 12841544
      • INV: Беспозвоночные - 15518735
      • MAM: Другие млекопитающие - 9429823
      • MUS: Мышь (Mus musculus) - 7424621
      • PHG: Бактериофаги - 5865
      • PLN: Растения - 33806044
      • PRO: Прокариоты - 909986
      • ROD: Грызуны - 2261678
      • SYN: Синтетические - 2671622
      • TGN: Трансгенные - 265465
      • UNC: Неклассифицированные - 3945859
      • VRL: Вирусы - 827405
      • VRT: Другие позвоночные - 10581253

    4. Количество стандартных (класса STD) записей, появвшееся в каждом из выбранных разделов за апрель 2009 года и за тот же месяц 2008 года.

      Во всех разделах, кроме HUM (человек), количество поступлений увеличилось по сравнению с предыдущим годом. Видимо, появилось больше возможностей работать с другими организмами, в то время как для работы с человеческими последовательностями большинство данных уже имеется.
       
  2.   Информация о гене ZNF173 из файла BA000025.embl.
    направление гена относительно направления, выбранного для записи прямое
    число кодирующих участков 7
    длина первого кодирующего участка 438
    длина последнего кодирующего участка 683
    длина первого интрона 1682
    длина последнего интрона 2612

     
  3. Самым длинным оказался 7-ой кодирующий участок(1755600..1756282, 683 bp). С помощью команды seqret была получена последовательность этого экзона (файл cds.fasta). С помощью blastx был проведен поиск соответствующего белка по Swiss-Prot (по организму Homo sapiens, e-value 0.001). c ID TRI26_HUMAN, точнее участок 3-173 CDS соответствует 314-370 АК белка, 369-548 - 436-539 АК (оба участка бедка по БД не имеют специфических функций). Странно, что ни один белок не соответствует центральной части данного кодирующего участка - видимо, ошибка в координатах cds.
     
  4.  Ссылки на банк EMBL в записи Swiss-Prot, описывающей белок GLUQ_ECOLI: U00096; AP009048; X64595; M34945. Сравните характеристики разных записей в кратком резюме.

    Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Длина последо-
    вательности
               
    Описание
               
    AP009048 genomic DNA STD PRO 22-JAN-2006 4646332 Escherichia coli str. K12 substr. W3110 DNA, complete genome.
    M34945 genomic DNA STD PRO 10-JUL-1990 1273 E.coli dnaK suppressor (dksA) gene, complete cds.
    U00096 genomic DNA STD PRO 23-FEB-2006 4639675 Escherichia coli str. K-12 substr. MG1655, complete genome.
    X64595 genomic DNA STD PRO 01-APR-1992 946 E.coli DNA sequence DKSA-PCNB
    В документе SwissProt лежат ссылки на файлы с последовательностями гена самого белка и всего генома бактерии. Обоих типов файлов - по 2, старые (за 1992 г.) и относительно новые (за 2006 г.)


© Smirnova Victoriya, 2009