На главную страницу третьего семестра

Занятие 2. Банк EMBL


  1. Сравнение разных записей в EMBL
  2. В документе SwissProt, описывающем белок DeoC_ECOLI, есть ссылки на банк EMBL (X03224; U14003; U00096).

    C помощью SRS получена следующая информация о записях:

    Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания
    документа
    Описание
    Длина последовательности
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome. 4639675
    U14003 genomic DNA STD PRO 30-NOV-1994 Escherichia coli K-12 chromosomal region from 92.8 to 00.1 minutes. 338534
    X03224 genomic DNA STD PRO 28-JAN-1986 Escherichia coli deoC gene for 2-deoxyribose 5-phosphate aldolase and deoA gene 5' region 1718

    Сравнение характеристик разных записей в кратком резюме.

    Запись X03224 содержит нуклеотидную последовательность белка DEOC_ECOLI => имеет сравнительно небольшой размер. Запись U14003 содержит кусок хромосомы кишечной палочки ( => среднего размера). Запись U00096 содержит весь геном кишечной палочки ( => очень большой размер). Если сравнить даты создания документов, то видно, что ген был внесен в БД очень давно, кусок генома - не так давно; а весь геном - совсем недавно (ген отсеквенирован раньше, и ошибки в соответствующем документе тоже исправлены раньше, а геном - позже, и ошибки в записи исправляются, наверное, до сих пор).

  3. Сравнение описаний гена Escherichia coli в двух разных записях EMBL
  4. На основании результатов упр.1. выбраны 2 записи для дальнейшего изучения. Документы были получены из БД, и составлена следующая таблица:

    Последовательности, кодирующие белок DeoC (AC P0A6L0) в двух записях банка EMBL

      I II
    ID записи  X03224  U14003
    Начало гена в записи  759  308154
    Конец гена в записи  1538  308933
    Направление гена  прямое  прямое
    Примечания Содержит, помимо гена deoC, начало другого гена (то, что ген обрезан, обозначается значком ..> ), продукт этого гена назван полипептидом deoA. "Обрезанный" ген - это ген deoA, кодирующий фермент тимидинфосфорилазу, участвующий вместе с deoC в одном метаболическом пути - синтезе 5'-фосфо-альфа-D-рибозо 1'-дифосфата из D-рибозо 5'-фосфата.

    К коментариям можно добавить то, что в генах указано положение участков (STS), которые можно обнаружить полимеразной цепной реакцией, по ним и их расположению можно идентифицировать геном.
    Из полученных записей были извлечены нуклеотидные последовательности, кодирующие белок. При сравнении обнаружилось, что в записи X03224 содержится замена, приводящая к замене аминокислоты в белке. В записи белка в поле CONFLICT содержится информация о данном несоответствии.
    Позиция от начала кодирующей последовательностиX03224U14003Позиция в кодонеСинонимична ли замена
    53AC2Нет (AAC Asn против ACC Thr-на самом деле)

  5. Знакомство с записью гена из эукариотического генома
  6. Документе EMBL с идентификационным номером BA000025 содержится ген BAT5..


©Хайруллин Альберт