Банк EMBL

  1. Сравнение разных записей в EMBL
  2. Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания
    документа
    Описание
    Длина последовательности
    AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome 4646332
    J05534 genomic DNA STD PRO 28-JUN-1990 Escherichia coli ATP-dependent clp protease proteolytic component (clpP) gene, complete cds. 1236
    M34066 genomic DNA STD PRO 01-MAY-1991 E.coli trigger factor (tig) gene, complete cds. 1816
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome 4639675
    U82664 genomic DNA STD PRO 19-JAN-1997 Escherichia coli minutes 9 to 11 genomic sequence. 139818
    X17642 genomic DNA STD PRO 08-FEB-1990 Escherichia coli bolA gene and associated promoter regions 1596

  3. Сравнение описаний гена Escherichia coli в двух разных записях EMBL
  4. На основании результатов упр.1 было выбрано 2 записи для дальнейшего изучения: - X17642 и - M34066 На основании полученных данных была заполнена таблица:

      I II
    ID записи X17642 M34066
    Начало гена в записи 1079 187
    Конец гена в записи 1516 1485
    Направление гена прямое прямое
    Примечания* - -

    Из полученных записей были извлечены нуклеотидные последовательности, кодирующие белок TIG_ECOLI, в виде отдельных файлов. В файле tig_gene1.fasta содержится участок с 187 по 624 из m34066 В файле tig_gene2.fasta содержится сохраненная последовательность x17642 (1079-1516) Процент совпадения составляет 98,9% результаты выравнивания Я провела еще одно сравнение, добившись 100% совпадения, вырезав из x17642 участок 1079-1428 и сохранив его в файле tig_gene1а.fasta; из m34066 был вырезан участок 187-536, в результате выравнивания , как я уже сказала было выявлено 100% совпадение. Т.е. несовпадения имеются на последнем участке


  5. Знакомство с записью гена из эукариотического генома
    • Документ EMBL с идентификационным номером L44140 Схематично изображена структура транслируемых участков предложенного гена "QM" (изображены только первый и последний транслируемые участки).
      Ген на комплементарной цепи:

      Ген на прямой цепи:

      --[68941..68977]--...--[ 71137..71372]--->
    • Общее число экзонов в гене очень не велико и составляет 6 экзонов.

      Длина самого длинного экзона - 236 Длина самого короткого экзона - 37

      Количество интронов и того меньше, их всего лиши 5.

      Длина самого длинного интрона -796 Длина самого короткого интрона -75 результаты