Третий семестр

Банк EMBL

  1. Сравнение разных записей в EMBL
  2. В документе SwissProt, описывающем белок DPO3X_ECOLI, нашла все ссылки на банк EMBL. C помощью SRS получила информацию, необходимую для заполнения таблицы.

    Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания
    документа
    Описание
    Длина последовательности
    U00096 геномная ДНК STD (стандартный) PRO (прокариоты) 23.12.2006 Escherichia coli K12 MG1655, полный геном. 4639675
    M38777 геномная ДНК STD PRO 23.09.1990 E.coli район генов apt-adk. 6820
    U82664 геномная ДНК STD PRO 19.01.1997 Часть генома Escherichia coli с 9 по 11 минуты. 139818
    X04275 геномная ДНК STD PRO 09.03.1987 E. coli днкZX репликационный ген 2218
    X04487 геномная ДНК STD PRO 07.06.1987 E.coli днкZX ген для ДНК полимеразы III субьединиц gamma (dnaZ) и tau (dnaX) 2775

    Сравниение характеристик разных записей: Длина последовательности с AC U00096 самая большая, последовательность - полный геномом Escherichia coli K12 MG1655, поэтому дата создания документа самая поздняя. Меньше длина у последовательности с 9 до 11 минуты с AC U82664, последовательность включает несколько генов, документ создан раньше. Запись с AC M38777 содержит район генов apt-adk, длина последовательности меньше, создан документ еще раньше. . Запись с AC содержит ген, кодирующий ДНК полимеразу III субьединиц gamma (dnaZ) и tau (dnaX), последовательность довольно короткая, дакумент создан раньше предыдущих. Запись с AC X04275 содержит ген, необходимый для репликации днкZX, длина последовательности самая маленькая.

  3. Сравнение описания.
  4. Выберала 2 записи для дальнейшего изучения. Выполняя команду entret embl:ID -auto получила 2 записи EMBL, в этих документах содержатся описания последовательности, кодирующей мой белок. Изучила документы и заполнила таблицу:

    Последовательности, кодирующие белок DPO3X_ECOLI в двух записях банка EMBL

      I II
    ID записи M38777 X04275
    Начало гена в записи 870 142
    Конец гена в записи 2801 2073
    Направление гена прямое прямое
    Примечания Гамма субъединица ДНК полимеразы III холофермент Escherichia coli производится с рибосомиальной рамки считывания. Ген кодирует 2 белка с разными молекулярными весами: белок X (Mw 75000-83000 d) и белок Z (Mw 52000-56500 d), эти белки являются субъединицами tau(X) и gamma(Z) ДНК полимеразы III.

    Извлекла из полученных записей нуклеотидные последовательности, кодирующие мой белок, в виде файлов gen1.fasta и gen2.fasta. Cравнила данные последовательности, построив их глобальное выравнивани с помощью needle. Последовательности совпадают на 100%.

  5. Знакомство с записью гена из эукариотического генома
  6. Изучила документ EMBL с идентификационным номером BA000025.

 
©Лавыш Дарья