Идентификатор записи EMBL | Тип молекулы | Класс данных | Раздел EMBL | Дата создания документа |
Описание | Длина последовательности |
AP009048 | genomic DNA | STD | PRO | 22-JAN-2006 | Escherichia coli W3110 DNA, complete genome | 4646332 |
U00096 | genomic DNA | STD | PRO | 23-FEB-2006 | Escherichia coli K12 MG1655, complete genome | 4639675 |
U73857 | genomic DNA | STD | PRO | 03-NOV-1996 | Escherichia coli chromosome minutes 6-8. | 128824 |
Сравнение характеристик разных записей: все три записи содержат информацию о геномной ДНК прокариот: Escherichia coli W3110, Escherichia coli K12 MG1655, Escherichia coli (штамм не указан). При этом в записях AP009048 и U00096 содержится полный геном Escherichia coli W3110 и Escherichia coli K12 MG1655 соответственно, а в записи U73857 лишь часть хромосомы: minutes 6-8. Так как в первых двух записях даны полные геномы, то длины молекул ДНК у них большие: 4646332 и 4639675, длина же фрагмента ДНК, содержащегося в записи U73857 очевидно меньше в несколько раз: 128824.
I | II | |
ID записи | U73857 | AP009048 |
Начало гена в записи | 50681 | 342108 |
Конец гена в записи | 51730 | 343157 |
Направление гена | прямое | прямое |
Примечания* | последовательность кодирует белок циннамилалкоголь дегидрогеназу |
последовательность кодирует белок предположително Zn-связывающую НАД(Ф) зависимую оксидоредуктазу |
Процент сходства 99.8%
позиция от начала кодирующей последовательности | нуклеотид в первом варианте | нуклеотид во втором варианте | позиция в кодоне | синонимична ли замена | 347 | t | c | 2 | не синонимична | 433 | t | c | 1 | не синонимична |
U73857 301 gac ggg ttg gaa aac tac tgt gat cac atg acc ggc acc tat aac ttg cc 350 ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| |.| || AP009048 301 gac ggg ttg gaa aac tac tgt gat cac atg acc ggc acc tat aac tcg cc 350
U73857 401 tc gtt cat gag cga tat gtt ctg cgt att cgt tac ccg caa gag cag ctg 450 || ||| ||| ||| ||| ||| ||| ||| ||| ||| ||| .|| ||| ||| ||| ||| ||| AP009048 401 tc gtt cat gag cga tat gtt ctg cgt att cgt cac ccg caa gag cag ctg 450
TTG - кодирует лейцин, а TCG - серин. Следовательно, замена в 347 позиции не может считаться синонемичной.
TAC - кодирует тирозин, а CAC-гистидин, тогда замена в 433 позиции также не является синонемичной, так как кодируются аминоксилоты с разными химическими свойствами.
Знакомство с записью гена из эукариотического генома человека
FT CDS complement(join(201945..202035,202133..202225, FT 202331..202407,202512..202747,202887..203073, FT 203521..203614,203980..204105,204283..204441, FT 205112..205329,205879..205987,206083..206120, FT 215978..216097))
<-[201945..202035]--...--[ 215978..216097]----
№ экзона | начало | конец | длина |
13 | 201336 | 202035 | 700 |
12 | 216731 | 217196 | 466 |
3 | 202512 | 202747 | 236 |
8 | 205112 | 205329 | 218 |
4 | 202887 | 203073 | 187 |
7 | 204283 | 204441 | 159 |
11 | 215978 | 216105 | 128 |
6 | 203980 | 204105 | 126 |
9 | 205879 | 205987 | 109 |
5 | 203521 | 203614 | 94 |
1 | 202133 | 202225 | 93 |
2 | 202331 | 202407 | 77 |
10 | 206083 | 206120 | 38 |
№ интрона | начало | конец | длина |
11 | 206121 | 215977 | 9857 |
8 | 204442 | 205111 | 670 |
12 | 216106 | 216730 | 625 |
9 | 205330 | 205878 | 549 |
5 | 203074 | 203520 | 447 |
6 | 203615 | 203979 | 365 |
7 | 204106 | 204282 | 177 |
4 | 202748 | 202886 | 139 |
2 | 202226 | 202330 | 105 |
3 | 202408 | 202511 | 104 |
1 | 202036 | 202132 | 97 |
10 | 205988 | 206082 | 95 |
Так же с таблицами эконов и интронов вы можете ознакомиться в файле ekzon_intron.xls