На главную страницу
На главную страницу третьего семестра

Банк EMBL

  1. Сравнение разных записей в EMBL
  2. C помощью SRS найдена информация о записях в банке EMBL.

    Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания документа
    Описание
    Длина последовательности
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome (полный геном Escherichia coli K12 MG1655) 4639675
    U18997 genomic DNA STD PRO 30-DEC-1994 Escherichia coli K-12 chromosomal region from 67.4 to 76.0 minutes (участок хромосомы с 67.4' по 76.0') 372438
    Y00710 genomic DNA STD PRO 12-MAR-1990 Escherichia coli aroE gene for shikimate dehydrogenase (EC 1.1.1.25) (ген шикимат дегидрогеназы) 819

    Первые две записи описывают крупный кусок генома (первая – весь геном), соответственно длина последовательности велика. Третья запись – ген белка AROE_ECOLI, его длина в 3 раза больше чем длина белковой последовательности + 1 (впоследствии удаляющийся метионин).
    Заметим, что сначала аннотирован ген белка, затем фрагмент генома и совсем недавно – полный геном.
    Все записи относятся разделу "ПРОКАРИОТЫ"
    Обозначение «67.4' по 76.0'» означает положение участка в кольцевой хромосоме, но единицы не совпадают с геометрическими минутами (1/60 градуса). Это время от начала конъюгации, на котором передается данный фрагмент.

  3. Сравнение описаний гена Escherichia coli в двух разных записях EMBL
  4. Выбрано 2 записи для дальнейшего изучения: Y00710 и U18997.

      I II
    ID записи Y00710 U18997
    Начало гена в записи 1 210766
    Конец гена в записи 819 211584
    Направление гена прямое обратное
    Примечания* Не указан штамм Escherichia coli. ID белка "CAA68700.1" ID белка "AAA58078.1" (не совпадают!)

    В графе

    В файлах AROE_gene1.fasta и AROE_gene2.fasta содержатся нуклеотидные последовательности, кодирующие белок AROE_ECOLI, из этих записей.
    Как показывает их выравнивание, построенное с помощью программы needle, они абсолютно идентичны (Identity=100%).

  5. Знакомство с записью гена из эукариотического генома
  6. В документе EMBL с идентификационным номером BA000025 был найден ген BAT3.
    При выполнении последних двух заданий использована программа Ms Excel.


©Семенюк Павел