Банк EMBL

  • Сравнение разных записей в EMBL
  • Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Описание Длина последовательности
    AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome 4646332
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome 4639675
    U73857 genomic DNA STD PRO 03-NOV-1996 Escherichia coli chromosome minutes 6-8. 128824

    Сравнение характеристик разных записей: все три записи содержат информацию о геномной ДНК прокариот: Escherichia coli W3110, Escherichia coli K12 MG1655, Escherichia coli (штамм не указан). При этом в записях AP009048 и U00096 содержится полный геном Escherichia coli W3110 и Escherichia coli K12 MG1655 соответственно, а в записи U73857 лишь часть хромосомы: minutes 6-8. Так как в первых двух записях даны полные геномы, то длины молекул ДНК у них большие: 4646332 и 4639675, длина же фрагмента ДНК, содержащегося в записи U73857 очевидно меньше в несколько раз: 128824.

  • Сравнение описаний гена Escherichia coli в двух разных записях EMBL Последовательности, кодирующие белок YAHK_ECOLI в двух записях банка EMBL
  •   I II
    ID записи U73857 AP009048
    Начало гена в записи 50681 342108
    Конец гена в записи 51730 343157
    Направление гена прямое прямое
    Примечания*

    последовательность кодирует белок циннамилалкоголь дегидрогеназу

    последовательность кодирует белок предположително Zn-связывающую НАД(Ф) зависимую оксидоредуктазу

    Процент сходства 99.8%

    позиция от начала кодирующей последовательности нуклеотид в первом варианте нуклеотид во втором варианте позиция в кодоне синонимична ли замена
    347 t c 2 не синонимична
    433 t c 1 не синонимична
        U73857           301 gac ggg ttg gaa aac tac tgt gat cac atg acc ggc acc tat aac ttg cc    350
                             ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| |.| ||
        AP009048         301 gac ggg ttg gaa aac tac tgt gat cac atg acc ggc acc tat aac tcg cc    350
    
        U73857           401 tc gtt cat gag cga tat gtt ctg cgt att cgt tac ccg caa gag cag ctg    450
                             || ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| .|| ||| ||| ||| ||| |||
        AP009048         401 tc gtt cat gag cga tat gtt ctg cgt att cgt cac ccg caa gag cag ctg    450
    

    TTG - кодирует лейцин, а TCG - серин. Следовательно, замена в 347 позиции не может считаться синонемичной.
    TAC - кодирует тирозин, а CAC-гистидин, тогда замена в 433 позиции также не является синонемичной, так как кодируются аминоксилоты с разными химическими свойствами.
    Знакомство с записью гена из эукариотического генома человека

  • Запись EMBL L44140
  • Имя гена или его продукта "G6PD
  • структура транслируемых участков предложенного мне гена

  • 	   FT   CDS             complement(join(201945..202035,202133..202225,
    FT                   202331..202407,202512..202747,202887..203073,
    FT                   203521..203614,203980..204105,204283..204441,
    FT                   205112..205329,205879..205987,206083..206120,
    FT                   215978..216097))
    

    Ген на комплементарной цепи:
    <-[201945..202035]--...--[ 215978..216097]----
  • общее число экзонов в гене 13
  • № экзона начало  конец длина
    13 201336 202035 700
    12 216731 217196 466
    3 202512 202747 236
    8 205112 205329 218
    4 202887 203073 187
    7 204283 204441 159
    11 215978 216105 128
    6 203980 204105 126
    9 205879 205987 109
    5 203521 203614 94
    1 202133 202225 93
    2 202331 202407 77
    10 206083 206120 38
  • Самый длинный экзон имеет длину 700 пар нуклеотидов: [ 201336...202035]
  • Самый короткий экзон имеет длину 38 пар нуклеотидов: [206083...206120]
  • № интрона начало конец длина
    11 206121 215977 9857
    8 204442 205111 670
    12 216106 216730 625
    9 205330 205878 549
    5 203074 203520 447
    6 203615 203979 365
    7 204106 204282 177
    4 202748 202886 139
    2 202226 202330 105
    3 202408 202511 104
    1 202036 202132 97
    10 205988 206082 95
  • Самый длинный интрон имеет длину 9857 пар нуклеотидов: [206121...215977]
  • Самый короткий интрон имеет длину 95 пар нуклеотидов: [205988...206082]
  • Так же с таблицами эконов и интронов вы можете ознакомиться в файле ekzon_intron.xls

    на главную