Банк EMBL

Задание выполнено в дериктории Term3 ,поддериктории Practice2 . Файл отчета- protocol.html

  1. Сравнение разных записей в EMBL
  2. Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания
    документа
    Описание
    Длина последовательности
      U00096  genomic DNA  STD  PRO   23-FEB-2006   Escherichia coli K12 MG1655, complete genome.  4639675
     AP009048  genomic DNA  STD  PRO   22-JAN-2006   Escherichia coli W3110 DNA, complete genome.   4646332
     D87842  genomic DNA  STD  PRO  05-JUN-1997  Escherichia coli DNA for DNA gyrase subunit B, acrB mutant, complete cds.  2415
     L10328  genomic DNA  STD  PRO  19-MAY-1993  E. coli; the region from 81.5 to 84.5 minutes.  136254
     M15548  genomic DNA  STD  PRO  16-JUL-1988  E.coli gyrB gene encoding gyrase B, partial cds.  179
     X04341  genomic DNA   STD  PRO  09-MAR-1987  E. coli genes dnaN (3'region), recF and gyrB  4931

    Выводы:
    все молекулы принадлежт к класу геномной ДНК прокариотических организмов. Даты секвенирования геномов довольно сильно разнятся. Самыми первыми были секвенированы небольшие кусочки генома, сам же геном полностью был секвенирован гораздо позже.
    Описание: первые 2 находки- полные геномы разных штампов организма(Escherichia coli K12 MG1655 и Escherichia coli W3110).Кроме того, были найдены куски моего гена, а так же куски гена в других геномах.

  3. Сравнение описаний гена Escherichia coli в двух разных записях EMBL в двух записях банка EMBL
  4.   I II
    ID записи  D87842   X04341
    Начало гена в записи  1  1180
    Конец гена в записи  2415  3594
    Направление гена  прамое  прямое
    Примечания*  acrB mutant  gyrase B (AA 1-804)

    Identity: 2411/2415 (99.8%)

    Выбранные последовательности действительно почти полностью схожи ( из более, чем 2000 н.к. они различны только в 4-х), что доказывает правильность выбора гена для сравнения.

    Выравнивание хранится здесь

  5. Знакомство с записью гена из эукариотического генома

  6. Знакомство с записью гена AF053356 из генома человека
    Ген эукариотрического генома, продуктом которого является "insulin receptor substrate like protein"

    Экзоны:

    complement(join(205045..205419,206400..206503,207230..207366,207897..208026,208286..>208349))

    Общее число экзонов: 5

    <----[205045..205419]---[206400..206503]--[207230..207366]--[207897..208026]--[208286..208349]--