Занятие 2. Банк EMBL

  1. Сравнение разных записей в EMBL
  2. Были получены данные о четырех записях в банке EMBL, коды доступа указаны в записи SwissProt белка KPYK1_ECOLI. Данные о записях приведены в таблице. 2 из найденных записей содержат полный геном и созданы значительно позже (2006 год), чем другие 2 (1990 и 1996 года), которые содержат либо ген (М24636), либо последовательность небольшого региона (U68703).

    Таблица результатов поиска SRS

    Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания
    документа
    Описание
    Длина последовательности
    AP009048 геномная ДНК стандартная запись последовательности прокариот 22 января 2006 полный геном Escherichia coli W3110 DNA 4646332
    М24636 геномная ДНК стандартная запись последовательности прокариот 20 апреля 1990 полная последовательность гена белка E.coli pyruvate kinase I (PK-1) 1830
    U00096 геномная ДНК стандартная запись последовательности прокариот 23 февраля 2006 полный геном Escherichia coli K12 MG1655 4639675
    U68703 геномная ДНК стандартная запись последовательности прокариот 20 сентября 1996 геном Escherichia coli K-12 MG1655, регион ribC-pykF 14601

  3. Сравнение описаний гена Escherichia coli в двух разных записях EMBL
  4. Для сравнения были выбраны записи участка ribC-pykF c ID U68703 и полной последовательности белка PK-1 E.coli c ID M24636.

    Последовательности, кодирующие белок Pyruvate kinase I в двух записях банка EMBL

      II I
    ID записи M24636 U68703
    Начало гена в записи 356 13102
    Конец гена в записи 1744 14514
    Направление гена прямое прямое

    C помощью программы needle было выяснено, что последовательности гена KPYK1_ECOLI совпадают на 98.2%, а различия двух нуклеотидных последовательностей составляют 1.8% (только гэпы). Замен нуклеотидов в выравнивании не наблюдалось.Но в полученной последовательности U68703, если посмотреть на выравнивание, есть гэп длиной в 1 нуклеотид после 14439, что означает сдвиг рамки считывания, а, следовательно, продукт экспрессии последовательности после гэпа не будет совпадать с таковым в последовательности М24636. C помощью программы BLAST был проведен поиск гомологов по полной последовательности М24636 и U68703. Было выяснено, что участок, транслируемый после 1703 позиции (она соответствует гэпу в последовательности U68703) в последовательности М24636, является уникальным и не встречается больше ни в каких белках. Тогда как участок, транслируемый с позиции после гэпа записи U68703 не является уникальным и встречается еще в нескольких белках (также сходных по функции, т.е. pyruvate kinase).

    Результаты BLAST: поиск по U68703

  5. Знакомство с записью гена из эукариотического генома
  6. Было проведено исследование записи гена EMBL AF053356, продуктом которого является erythropoietin. Ген находится на комплементарной цепи, состоит из 6 экзонов и 5 интронов. Длина самого короткого экзона - 13, самого длинного - 240. Самый короткий интрон - 489, самый длинный - 876. Средняя длина экзона - 133, интрона - 527, т.е. длина экзона примерно в 4 раза короче интрона в данном гене. Рассчеты проводились с помощью Excel.

    Схема транслируемого участка:

    <-[54220..54375]--...--[56356..56368]----