|
Занятие 2. Банк EMBL
-
Сравнение разных записей в EMBL
В документе SwissProt, описывающем белок ILVC_ECOLI, найдены 4 ссылки на банк EMBL.
C помощью SRS на запрос по этим ссылкам получено 4 записи в EMBL:
Идентификатор записи EMBL
|
Тип молекулы
|
Класс данных
|
Раздел EMBL
|
Дата создания
документа |
Описание
|
Длина последовательности
|
U00096 |
genomic DNA |
STD |
PRO |
23-FEB-2006 |
Escherichia coli K12 MG1655, complete genome. |
4639675 |
AP009048 |
genomic DNA |
STD |
PRO |
22-JAN-2006 |
Escherichia coli W3110 DNA, complete genome. |
4646332 |
M11689 |
genomic DNA |
STD |
PRO |
19-SEP-1987 |
E.coli (clone pRW[1Y,1C]) threonine deaminase (ilvA) gene, 3' end; acetohydroxy acid isomeroreductase (ilvC) and its positive control factor (ilvY) genes, complete cds. |
2833 |
M87049 |
genomic DNA |
STD |
PRO |
31-AUG-1992 |
E. coli genomic sequence of the region from 84.5 to 86.5 minutes. |
91414 |
Итого, две записи описывают полный геном (E.coli разных штаммов - K12 и W3110) , остальные две - участки ДНК.
Отличаются записи длиной последовательности и датой создания.
-
Сравнение описаний гена Escherichia coli в двух разных записях EMBL
Последовательности, кодирующие белок ILVC_ECOLI, в двух записях банка EMBL:
|
I |
II |
ID записи |
M11689 |
M87049 |
Начало гена в записи |
1150 |
11104 |
Конец гена в записи |
2625 |
12579 |
Направление гена |
прямое |
прямое |
Сравнение нуклеотидных последовательностей, кодирующих белок ILVC_ECOLI, взятых из разных записей:
|
I |
II |
Позиция от начала кодирующей последовательности |
750 |
751 |
Нуклеотид в первом варианте (М11689) |
g |
a |
Нуклеотид во втором варианте (М87049) |
a |
g |
Позиция в кодоне |
3 |
1 |
Синонимична ли замена |
да |
нет |
Замена синонимична в 750 позиции, т.к. оба триплета (gcg и gca) кодируют аланин
и не синонимична в 751 позиции, т.к. ааа кодирует лизин, а gaa - глутаминовую кислоту.
M11689 1 atggctaactacttcaatacactgaatctgcgccagcagctggcacagct 50
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1 atggctaactacttcaatacactgaatctgcgccagcagctggcacagct 50
M11689 51 gggcaaatgtcgctttatgggccgcgatgaattcgccgatggcgcgagct 100
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 51 gggcaaatgtcgctttatgggccgcgatgaattcgccgatggcgcgagct 100
M11689 101 accttcagggtaaaaaagtagtcatcgtcggctgtggcgcacagggtctg 150
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 101 accttcagggtaaaaaagtagtcatcgtcggctgtggcgcacagggtctg 150
M11689 151 aaccagggcctgaacatgcgtgattctggtctcgatatctcctacgctct 200
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 151 aaccagggcctgaacatgcgtgattctggtctcgatatctcctacgctct 200
M11689 201 gcgtaaagaagcgattgccgagaagcgcgcgtcctggcgtaaagcgaccg 250
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 201 gcgtaaagaagcgattgccgagaagcgcgcgtcctggcgtaaagcgaccg 250
M11689 251 aaaatggttttaaagtgggtacttacgaagaactgatcccacaggcggat 300
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 251 aaaatggttttaaagtgggtacttacgaagaactgatcccacaggcggat 300
M11689 301 ctggtgattaacctgacgccggacaagcagcactctgatgtagtgcgcac 350
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 301 ctggtgattaacctgacgccggacaagcagcactctgatgtagtgcgcac 350
M11689 351 cgtacagccactgatgaaagacggcgcggcgctgggctactcgcacggtt 400
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 351 cgtacagccactgatgaaagacggcgcggcgctgggctactcgcacggtt 400
M11689 401 tcaacatcgtcgaagtgggcgagcagatccgtaaagatatcaccgtagtg 450
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 401 tcaacatcgtcgaagtgggcgagcagatccgtaaagatatcaccgtagtg 450
M11689 451 atggttgcgccgaaatgcccaggcaccgaagtgcgtgaagagtacaaacg 500
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 451 atggttgcgccgaaatgcccaggcaccgaagtgcgtgaagagtacaaacg 500
M11689 501 tgggttcggcgtaccgacgctgattgccgttcacccggaaaacgatccga 550
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 501 tgggttcggcgtaccgacgctgattgccgttcacccggaaaacgatccga 550
M11689 551 aaggcgaaggcatggcgattgccaaagcctgggcggctgcaaccggtggt 600
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 551 aaggcgaaggcatggcgattgccaaagcctgggcggctgcaaccggtggt 600
M11689 601 caccgtgcgggtgtgctggaatcgtccttcgttgcggaagtgaaatctga 650
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 601 caccgtgcgggtgtgctggaatcgtccttcgttgcggaagtgaaatctga 650
M11689 651 cctgatgggcgagcaaaccatcctgtgcggtatgttgcaggctggctctc 700
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 651 cctgatgggcgagcaaaccatcctgtgcggtatgttgcaggctggctctc 700
M11689 701 tgctgtgcttcgacaagctggtggaagaaggtaccgatccagcatacgcg 750
|||||||||||||||||||||||||||||||||||||||||||||||||.
M87049 701 tgctgtgcttcgacaagctggtggaagaaggtaccgatccagcatacgca 750
M11689 751 aaaaaactgattcagttcggttgggaaaccatcaccgaagcactgaaaca 800
.|||||||||||||||||||||||||||||||||||||||||||||||||
M87049 751 gaaaaactgattcagttcggttgggaaaccatcaccgaagcactgaaaca 800
M11689 801 gggcggcatcaccctgatgatggaccgtctctctaacccggcgaaactgc 850
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 801 gggcggcatcaccctgatgatggaccgtctctctaacccggcgaaactgc 850
M11689 851 gtgcttatgcgctttctgaacagctgaaagagatcatggcacccctgttc 900
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 851 gtgcttatgcgctttctgaacagctgaaagagatcatggcacccctgttc 900
M11689 901 cagaaacatatggacgacatcatctccggcgaattctcttccggtatgat 950
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 901 cagaaacatatggacgacatcatctccggcgaattctcttccggtatgat 950
M11689 951 ggcggactgggccaacgatgataagaaactgctgacctggcgtgaagaga 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 951 ggcggactgggccaacgatgataagaaactgctgacctggcgtgaagaga 1000
M11689 1001 ccggcaaaaccgcgtttgaaaccgcgccgcagtatgaaggcaaaatcggc 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1001 ccggcaaaaccgcgtttgaaaccgcgccgcagtatgaaggcaaaatcggc 1050
M11689 1051 gagcaggagtacttcgataaaggcgtactgatgattgcgatggtgaaagc 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1051 gagcaggagtacttcgataaaggcgtactgatgattgcgatggtgaaagc 1100
M11689 1101 gggcgttgaactggcgttcgaaaccatggtcgattccggcatcattgaag 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1101 gggcgttgaactggcgttcgaaaccatggtcgattccggcatcattgaag 1150
M11689 1151 agtctgcatattatgaatcactgcacgagctgccgctgattgccaacacc 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1151 agtctgcatattatgaatcactgcacgagctgccgctgattgccaacacc 1200
M11689 1201 atcgcccgtaagcgtctgtacgaaatgaacgtggttatctctgataccgc 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1201 atcgcccgtaagcgtctgtacgaaatgaacgtggttatctctgataccgc 1250
M11689 1251 tgagtacggtaactatctgttctcttacgcttgtgtgccgttgctgaaac 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1251 tgagtacggtaactatctgttctcttacgcttgtgtgccgttgctgaaac 1300
M11689 1301 cgtttatggcagagctgcaaccgggcgacctgggtaaagctattccggaa 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1301 cgtttatggcagagctgcaaccgggcgacctgggtaaagctattccggaa 1350
M11689 1351 ggcgcggtagataacgggcaactgcgtgatgtgaacgaagcgattcgcag 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1351 ggcgcggtagataacgggcaactgcgtgatgtgaacgaagcgattcgcag 1400
M11689 1401 ccatgcgattgagcaggtaggtaagaaactgcgcggctatatgacagata 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
M87049 1401 ccatgcgattgagcaggtaggtaagaaactgcgcggctatatgacagata 1450
M11689 1451 tgaaacgtattgctgttgcgggttaa 1476
||||||||||||||||||||||||||
M87049 1451 tgaaacgtattgctgttgcgggttaa 1476
-
Знакомство с записью гена из эукариотического генома
Идентификационный номер записи EMBL: AL355388 /gene="SSR2"
Кодирует белки Sw:P23438 Sw:P43308 Sw:Q9CPW5 Sw:Q9CPW5 Sw:Q9CPW5 Sw:Q9CPW5 Sw:Q9CPW5 Tr:Q90Z39 Tr:Q98SP1
Длины посчитаны с помощью Excel (таблица - "/home/students/y06/pozdyshev/Term3/Practice2/intr_ekz.xls)
|