Банк EMBL

1. Сравнение разных записей в EMBL

 

P0A6V8

GLK_ECOLI

b2388

glk

1sz2

 

DR   EMBL; U22490; AAA64506.1; -; Genomic_DNA.
DR   EMBL; D90868; BAA16258.1; -; Genomic_DNA.
DR   EMBL; D90869; BAA16261.1; -; Genomic_DNA.
DR   EMBL; U00096; AAC75447.1; -; Genomic_DNA.

 

Query "((([embl-AccNumber:U22490*] | [embl-AccNumber:D90868*]) | [embl-AccNumber:D90869*]) | [embl-AccNumber:U00096*]) " found 5 entries

 

Идентификатор

Записи EMBL

Тип молекулы

Класс данных

 

Раздел EMBL

 

Дата создания
документа

Описание

 

Длина последовательности

U00096

genomic DNA

Standard

Прокариоты

23-FEB-2006

Escherichia coli K12 MG1655, complete genome.

4639675

D90868

genomic DNA

Standard

Прокариоты

30-JAN-1997

Replaced by AP009048 on 20-JAN-2006.

1

D90869

genomic DNA

Standard

Прокариоты

30-JAN-1997

Replaced by AP009048 on 20-JAN-2006.

1

AP009048

genomic DNA

Standard

Прокариоты

22-JAN-2006

Escherichia coli W3110 DNA, complete genome.

4646332

U22490

genomic DNA

Standard

Прокариоты

15-APR-1995

Escherichia coli glucokinase (glk) gene, complete cds.

1278

 

   U00096       Полный геном
         D90868       Указание на геном AP009048
         D90869       Указание на геном AP009048
         AP00904     Полный геном
         U22490       Иследуемый ген

 

 2. Сравнение описаний гена Escherichia coli в двух разных записях EMBL

Последовательности, кодирующие белок Glucokinase в двух записях банка данных EMBL.

 

 

I

II

ID записи

 U22490.1

 U00096.2

Начало гена в записи

 139

 2506483

Конец гена в записи

 1104

 2507448

Направление гена

 Прямое

Комплементарное

Примечания*

Ген glk белка glucokinase

/organism="Escherichia coli"

/strain="K-12"

 Ген glk белка glucokinase

/organism="Escherichia coli K12"

/strain="K-12"

 

 

Для двух нуклеотидных последовательностей идентичность равна  99,6% (963/967), а идентичность двух аминокислотных последовательностей, закодированных в исследуемых нуклеотидных последовательностях, равна 98,8% (317/321). Замена 323 нуклеотида A нуклеотидом T привела к замена кодона AAC кодоном ATC, что привело к замене аминокислоты Asn аминокислотой Ile. Замена нуклеотида G 821 нуклеотидом C привела к замене кодона GGC кодоном GCC и, следовательно, замене аминокислоты Gly аминокислотой Ala. Гэпы приводят к замене двух аминокислот Ala и Cys аминокислотами Arg и Val.

 

 

U22490             1 atgacaaagtatgcattagtcggtgatgtgggcggcaccaacgcacgtct     50
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096             1 atgacaaagtatgcattagtcggtgatgtgggcggcaccaacgcacgtct     50
 
U22490            51 tgctctgtgtgatattgccagtggtgaaatctcgcaggctaagacctatt    100
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096            51 tgctctgtgtgatattgccagtggtgaaatctcgcaggctaagacctatt    100
 
U22490           101 cagggcttgattaccccagcctcgaagcggtcattcgcgtttatcttgaa    150
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           101 cagggcttgattaccccagcctcgaagcggtcattcgcgtttatcttgaa    150
 
U22490           151 gaacataaggtcgaggtgaaagacggctgtattgccatcgcttgcccaat    200
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           151 gaacataaggtcgaggtgaaagacggctgtattgccatcgcttgcccaat    200
 
U22490           201 taccggtgactgggtggcgatgaccaaccatacctgggcgttctcaattg    250
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           201 taccggtgactgggtggcgatgaccaaccatacctgggcgttctcaattg    250
 
U22490           251 ccgaaatgaaaaagaatctcggttttagccatctggaaattattaacgat    300
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           251 ccgaaatgaaaaagaatctcggttttagccatctggaaattattaacgat    300
 
U22490           301 tttaccgctgtatcgatggcgaacccgatgctgaaaaaagagcatctgat    350
                     ||||||||||||||||||||||.|||||||||||||||||||||||||||
U00096           301 tttaccgctgtatcgatggcgatcccgatgctgaaaaaagagcatctgat    350
 
U22490           351 tcagtttggtggcgcagaaccggtcgaaggtaagcctattgcggtttacg    400
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           351 tcagtttggtggcgcagaaccggtcgaaggtaagcctattgcggtttacg    400
 
U22490           401 gtgccggaacggggcttggggttgcgcatctggtccatgtcgataagcgt    450
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           401 gtgccggaacggggcttggggttgcgcatctggtccatgtcgataagcgt    450
 
U22490           451 tgggtaagcttgccaggcgaaggcggtcacgttgattttgcgccgaatag    500
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           451 tgggtaagcttgccaggcgaaggcggtcacgttgattttgcgccgaatag    500
 
U22490           501 tgaagaagaggccattatcctcgaaatattgcgtgcggaaattggtcatg    550
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           501 tgaagaagaggccattatcctcgaaatattgcgtgcggaaattggtcatg    550
 
U22490           551 tttcggcggag-gcgtgcctttctggccctgggctggtgaatttgtatcg    599
                     ||||||||||| ||||| ||||||||||||||||||||||||||||||||
U00096           551 tttcggcggagcgcgtg-ctttctggccctgggctggtgaatttgtatcg    599
 
U22490           600 cgcaattgtgaaagctgacaaccgcctgccagaaaatctcaagccaaaag    649
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           600 cgcaattgtgaaagctgacaaccgcctgccagaaaatctcaagccaaaag    649
 
U22490           650 atattaccgaacgcgcgctggctgacagctgcaccgattgccgccgcgca    699
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           650 atattaccgaacgcgcgctggctgacagctgcaccgattgccgccgcgca    699
 
U22490           700 ttgtcgctgttttgcgtcattatgggccgttttggcggcaatctggcgct    749
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           700 ttgtcgctgttttgcgtcattatgggccgttttggcggcaatctggcgct    749
 
U22490           750 caatctcgggacatttggcggcgtgtttattgcgggcggtatcgtgccgc    799
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           750 caatctcgggacatttggcggcgtgtttattgcgggcggtatcgtgccgc    799
 
U22490           800 gcttccttgagttcttcaaaggctccggtttccgtgccgcatttgaagat    849
                     |||||||||||||||||||||.||||||||||||||||||||||||||||
U00096           800 gcttccttgagttcttcaaagcctccggtttccgtgccgcatttgaagat    849
 
U22490           850 aaagggcgctttaaagaatatgtccatgatattccggtgtatctcatcgt    899
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           850 aaagggcgctttaaagaatatgtccatgatattccggtgtatctcatcgt    899
 
U22490           900 ccatgacaatccgggccttctcggttccggtgcacatttacgccagacct    949
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
U00096           900 ccatgacaatccgggccttctcggttccggtgcacatttacgccagacct    949
 
U22490           950 taggtcacattctgtaa    966
                     |||||||||||||||||
U00096           950 taggtcacattctgtaa    966

 

 

 

GLK ECOLI (1)      1 MTKYALVGDVGGTNARLALCDIASGEISQAKTYSGLDYPSLEAVIRVYLE     50
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
GLK ECOLI (2)      1 MTKYALVGDVGGTNARLALCDIASGEISQAKTYSGLDYPSLEAVIRVYLE     50
 
GLK ECOLI (1)     51 EHKVEVKDGCIAIACPITGDWVAMTNHTWAFSIAEMKKNLGFSHLEIIND    100
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
GLK ECOLI (2)     51 EHKVEVKDGCIAIACPITGDWVAMTNHTWAFSIAEMKKNLGFSHLEIIND    100
 
GLK ECOLI (1)    101 FTAVSMANPMLKKEHLIQFGGAEPVEGKPIAVYGAGTGLGVAHLVHVDKR    150
                     |||||||.||||||||||||||||||||||||||||||||||||||||||
GLK ECOLI (2)    101 FTAVSMAIPMLKKEHLIQFGGAEPVEGKPIAVYGAGTGLGVAHLVHVDKR    150
 
GLK ECOLI (1)    151 WVSLPGEGGHVDFAPNSEEEAIILEILRAEIGHVSAEACLSGPGLVNLYR    200
                     |||||||||||||||||||||||||||||||||||||..|||||||||||
GLK ECOLI (2)    151 WVSLPGEGGHVDFAPNSEEEAIILEILRAEIGHVSAERVLSGPGLVNLYR    200
 
GLK ECOLI (1)    201 AIVKADNRLPENLKPKDITERALADSCTDCRRALSLFCVIMGRFGGNLAL    250
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
GLK ECOLI (2)    201 AIVKADNRLPENLKPKDITERALADSCTDCRRALSLFCVIMGRFGGNLAL    250
 
GLK ECOLI (1)    251 NLGTFGGVFIAGGIVPRFLEFFKGSGFRAAFEDKGRFKEYVHDIPVYLIV    300
                     |||||||||||||||||||||||.||||||||||||||||||||||||||
GLK ECOLI (2)    251 NLGTFGGVFIAGGIVPRFLEFFKASGFRAAFEDKGRFKEYVHDIPVYLIV    300
 
GLK ECOLI (1)    301 HDNPGLLGSGAHLRQTLGHIL    321
                     |||||||||||||||||||||
GLK ECOLI (2)    301 HDNPGLLGSGAHLRQTLGHIL    321

 

3. Ген эукариотического генома

 
FT   exon            214850..215164
FT                   /number=1
FT                   /gene="DDAH"
FT   CDS             join(214868..215164,215284..215383,215505..215578,
FT                   215737..215856,216337..216486,216676..216792)
FT                   /codon_start=1
FT                   /db_xref="GOA:O95865"
FT                   /db_xref="HGNC:2716"
FT                   /db_xref="InterPro:IPR003198"
FT                   /db_xref="UniProtKB/Swiss-Prot:O95865"
FT                   /note="alternative name: NG30, G6a"
FT                   /transl_table=1
FT                   /gene="DDAH"
FT                   /product="NG-dimethylarginine dimethylamino hydrolase
FT                   homolog"
FT                   /protein_id="BAB63377.1"
FT                   /translation="MGTPGEGLGRCSHALIRGVPESLASGEGAGAGLPALDLAKAQREH
FT                   GVLGGKLRQRLGLQLLELPPEESLPLGPLLGDTAVIQGDTALITRPWSPARRPEVDGVR
FT                   KALQDLGLRIVEIGDENATLDGTDVLFTGREFFVGLSKWTNHRGAEIVADTFRDFAVST
FT                   VPVSGPSHLRGLCGMGGPRTVVAGSSDAAQKAVRAMAVLTDHPYASLTLPDDAAADCLF
FT                   LRPGLPGVPPFLLHRGGGDLPNSQEALQKLSDVTLVPVSCSELEKAGAGLSSLCLVLST
FT                   RPHS"
FT   exon            215284..215383
FT                   /number=2
FT                   /gene="DDAH"
FT   exon            215505..215578
FT                   /number=3
FT                   /gene="DDAH"
FT   exon            215737..215856
FT                   /number=4
FT                   /gene="DDAH"
FT   exon            216337..216486
FT                   /number=5
FT                   /gene="DDAH"
FT   exon            216676..216987
FT                   /number=6
FT                   /gene="DDAH"

 

Ген на прямой цепи

 

tyle="text-indent:18.0pt">--[214850..215164]- -[214868..215164]--[ 215284..215383]--[ 215505..215578]--[ 215737..215856]--[ 216337..216486]--[ 216676..216987]-- >

 

Число экзонов в гене равняется 6.

214850

215164

314

 

215284

215383

99

 

215505

215578

73

 

215737

215856

119

 

216337

216486

149

 

216676

216987

311

 

 

Самый длинный интрон 4 длиной 481 нуклеотида, самый короткий интрон 1 длиной 120 нуклеотидов.

Самый длинный 1 экзон 314 нуклеотидов, самый короткий 3 экзон 73 нуклеотида

.

На главную страницу третьего семестра


©Дмитрий