На главную страницу третьего семестра Банк EMBL

Работа с БД EMBL.

  1. В данной таблице представленны результаты запроса по белку AMPA_ECOLI в БД EMBL.
    Раздел EMBL Индетификатор записи EMBL Тип молекулы Класс данных Царство Длина последовательности Дата создания документа Описание
      EMBL:U00096 U00096
    геномная ДНК
    STD
    PRO
    4639675
    23.02.2006
    Escherichia coli K12 MG1655, полный геном.
      EMBL:U14003
    U14003
    геномная ДНК
    STD
    PRO
    338534
    30.11.1994
    Escherichia coli K-12 хромосомный участок с 92.8 до 00.1 минуты.
      EMBL:X15130 X15130
    геномная ДНК
    STD
    PRO
    2038
    06.07.1989
    E. coli xerB ген аминопептидазы A/I (EC 3.4.11.1)
      EMBL:X86443 X86443
    геномная ДНК
    STD
    PRO
    2232
    06.11.1995
    E.coli pepA/carP ген
      EMBL:AP009048 AP009048
    геномная ДНК
    STD
    PRO
    4646332
    22.01.2006
    Escherichia coli W3110 DNA, полный геном.

    Все находки относятся к стандартному классу данных. Длина последовательности варьируется от 2038 до 4646332(в случае полного генома). Наиболее раннй документ создан 06.07.1989, последний добавлен относительно недавно - 23.02.2006. Полный геном Escherichia coli K-12 представлен в документе U00096, также представлен полный геном другого штамма.

  2. Из вышеперечисленных находок, я выбрала две, X86443 и X15130, для сравнения. Ниже приведенная таблица содержит данные, взятые из соответсвующих документов EMBL.
      I II
    ID записи X86443 X15130
    Начало гена в записи 371 60
    Конец гена в записи 1882 1571
    Направление гена Прямое Прямое

    Затем из этих файлов были извлечены последовательности, кодирующие белок AMPA_ECOLI:из X15130 и из X86443 Эти две последовательности были выравнены при помощи программы needle. Процент идентичности довольно мал - 81%. С первой по 311 позицию выравнивания на месте последовательности X15130 и с 2241 по 2349 на месте последовательности Х86443 стоят гэпы. Между этими значениями нет ни гэпов, ни замен.

  3. Был дан документ EMBL с номром ВА000025. В нем надо было найти информацию о гене HLA-C и схематично указать нахождение его транслируемых учасков (экзонов).
    Ген на прямой цепи.
    -[671525...671597]-...-[672248...672523]-...-[673111...673386]-...-[673511...673630]-...-[674071...674103]-...-[674211...674258]-...-[674423...674759]->
    В данном гене 8 экзонов и, соответсвенно, 7 интронов.
    ©Попенко Анна