Занятие 2. Банк EMBL

  1. Сравнение разных записей в EMBL
  2. В документе SwissProt, описывающем белок ILVC_ECOLI, найдены 4 ссылки на банк EMBL.

    C помощью SRS на запрос по этим ссылкам получено 4 записи в EMBL:

    Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания
    документа
    Описание
    Длина последовательности
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome. 4639675
    AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome. 4646332
    M11689 genomic DNA STD PRO 19-SEP-1987 E.coli (clone pRW[1Y,1C]) threonine deaminase (ilvA) gene, 3' end; acetohydroxy acid isomeroreductase (ilvC) and its positive control factor (ilvY) genes, complete cds. 2833
    M87049 genomic DNA STD PRO 31-AUG-1992 E. coli genomic sequence of the region from 84.5 to 86.5 minutes. 91414

    Итого, две записи описывают полный геном (E.coli разных штаммов - K12 и W3110) , остальные две - участки ДНК.
    Отличаются записи длиной последовательности и датой создания.

  3. Сравнение описаний гена Escherichia coli в двух разных записях EMBL
  4. Последовательности, кодирующие белок ILVC_ECOLI, в двух записях банка EMBL:

      I II
    ID записи M11689 M87049
    Начало гена в записи 1150 11104
    Конец гена в записи 2625 12579
    Направление гена прямое прямое

    Сравнение нуклеотидных последовательностей, кодирующих белок ILVC_ECOLI, взятых из разных записей:

    I II
    Позиция от начала кодирующей последовательности 750 751
    Нуклеотид в первом варианте (М11689) g a
    Нуклеотид во втором варианте (М87049) a g
    Позиция в кодоне 3 1
    Синонимична ли замена да нет

    Замена синонимична в 750 позиции, т.к. оба триплета (gcg и gca) кодируют аланин и не синонимична в 751 позиции, т.к. ааа кодирует лизин, а gaa - глутаминовую кислоту.

    M11689             1 atggctaactacttcaatacactgaatctgcgccagcagctggcacagct     50 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049             1 atggctaactacttcaatacactgaatctgcgccagcagctggcacagct     50 
                                                                                   
    M11689            51 gggcaaatgtcgctttatgggccgcgatgaattcgccgatggcgcgagct    100 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049            51 gggcaaatgtcgctttatgggccgcgatgaattcgccgatggcgcgagct    100 
                                                                                   
    M11689           101 accttcagggtaaaaaagtagtcatcgtcggctgtggcgcacagggtctg    150 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           101 accttcagggtaaaaaagtagtcatcgtcggctgtggcgcacagggtctg    150 
                                                                                   
    M11689           151 aaccagggcctgaacatgcgtgattctggtctcgatatctcctacgctct    200 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           151 aaccagggcctgaacatgcgtgattctggtctcgatatctcctacgctct    200 
                                                                                   
    M11689           201 gcgtaaagaagcgattgccgagaagcgcgcgtcctggcgtaaagcgaccg    250 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           201 gcgtaaagaagcgattgccgagaagcgcgcgtcctggcgtaaagcgaccg    250 
                                                                                   
    M11689           251 aaaatggttttaaagtgggtacttacgaagaactgatcccacaggcggat    300 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           251 aaaatggttttaaagtgggtacttacgaagaactgatcccacaggcggat    300 
                                                                                   
    M11689           301 ctggtgattaacctgacgccggacaagcagcactctgatgtagtgcgcac    350 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           301 ctggtgattaacctgacgccggacaagcagcactctgatgtagtgcgcac    350 
                                                                                   
    M11689           351 cgtacagccactgatgaaagacggcgcggcgctgggctactcgcacggtt    400 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           351 cgtacagccactgatgaaagacggcgcggcgctgggctactcgcacggtt    400 
                                                                                   
    M11689           401 tcaacatcgtcgaagtgggcgagcagatccgtaaagatatcaccgtagtg    450 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           401 tcaacatcgtcgaagtgggcgagcagatccgtaaagatatcaccgtagtg    450 
                                                                                   
    M11689           451 atggttgcgccgaaatgcccaggcaccgaagtgcgtgaagagtacaaacg    500 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           451 atggttgcgccgaaatgcccaggcaccgaagtgcgtgaagagtacaaacg    500 
                                                                                   
    M11689           501 tgggttcggcgtaccgacgctgattgccgttcacccggaaaacgatccga    550 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           501 tgggttcggcgtaccgacgctgattgccgttcacccggaaaacgatccga    550 
                                                                                   
    M11689           551 aaggcgaaggcatggcgattgccaaagcctgggcggctgcaaccggtggt    600 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           551 aaggcgaaggcatggcgattgccaaagcctgggcggctgcaaccggtggt    600 
                                                                                   
    M11689           601 caccgtgcgggtgtgctggaatcgtccttcgttgcggaagtgaaatctga    650 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           601 caccgtgcgggtgtgctggaatcgtccttcgttgcggaagtgaaatctga    650 
                                                                                   
    M11689           651 cctgatgggcgagcaaaccatcctgtgcggtatgttgcaggctggctctc    700 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           651 cctgatgggcgagcaaaccatcctgtgcggtatgttgcaggctggctctc    700 
                                                                                   
    M11689           701 tgctgtgcttcgacaagctggtggaagaaggtaccgatccagcatacgcg    750 
                         |||||||||||||||||||||||||||||||||||||||||||||||||.        
    M87049           701 tgctgtgcttcgacaagctggtggaagaaggtaccgatccagcatacgca    750 
                                                                                   
    M11689           751 aaaaaactgattcagttcggttgggaaaccatcaccgaagcactgaaaca    800 
                         .|||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           751 gaaaaactgattcagttcggttgggaaaccatcaccgaagcactgaaaca    800 
                                                                                   
    M11689           801 gggcggcatcaccctgatgatggaccgtctctctaacccggcgaaactgc    850 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           801 gggcggcatcaccctgatgatggaccgtctctctaacccggcgaaactgc    850 
                                                                                   
    M11689           851 gtgcttatgcgctttctgaacagctgaaagagatcatggcacccctgttc    900 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           851 gtgcttatgcgctttctgaacagctgaaagagatcatggcacccctgttc    900 
                                                                                   
    M11689           901 cagaaacatatggacgacatcatctccggcgaattctcttccggtatgat    950 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           901 cagaaacatatggacgacatcatctccggcgaattctcttccggtatgat    950 
                                                                                   
    M11689           951 ggcggactgggccaacgatgataagaaactgctgacctggcgtgaagaga   1000 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049           951 ggcggactgggccaacgatgataagaaactgctgacctggcgtgaagaga   1000 
                                                                                   
    M11689          1001 ccggcaaaaccgcgtttgaaaccgcgccgcagtatgaaggcaaaatcggc   1050 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1001 ccggcaaaaccgcgtttgaaaccgcgccgcagtatgaaggcaaaatcggc   1050 
                                                                                   
    M11689          1051 gagcaggagtacttcgataaaggcgtactgatgattgcgatggtgaaagc   1100 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1051 gagcaggagtacttcgataaaggcgtactgatgattgcgatggtgaaagc   1100 
                                                                                   
    M11689          1101 gggcgttgaactggcgttcgaaaccatggtcgattccggcatcattgaag   1150 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1101 gggcgttgaactggcgttcgaaaccatggtcgattccggcatcattgaag   1150 
                                                                                   
    M11689          1151 agtctgcatattatgaatcactgcacgagctgccgctgattgccaacacc   1200 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1151 agtctgcatattatgaatcactgcacgagctgccgctgattgccaacacc   1200 
                                                                                   
    M11689          1201 atcgcccgtaagcgtctgtacgaaatgaacgtggttatctctgataccgc   1250 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1201 atcgcccgtaagcgtctgtacgaaatgaacgtggttatctctgataccgc   1250 
                                                                                   
    M11689          1251 tgagtacggtaactatctgttctcttacgcttgtgtgccgttgctgaaac   1300 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1251 tgagtacggtaactatctgttctcttacgcttgtgtgccgttgctgaaac   1300 
                                                                                   
    M11689          1301 cgtttatggcagagctgcaaccgggcgacctgggtaaagctattccggaa   1350 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1301 cgtttatggcagagctgcaaccgggcgacctgggtaaagctattccggaa   1350 
                                                                                   
    M11689          1351 ggcgcggtagataacgggcaactgcgtgatgtgaacgaagcgattcgcag   1400 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1351 ggcgcggtagataacgggcaactgcgtgatgtgaacgaagcgattcgcag   1400 
                                                                                   
    M11689          1401 ccatgcgattgagcaggtaggtaagaaactgcgcggctatatgacagata   1450 
                         ||||||||||||||||||||||||||||||||||||||||||||||||||        
    M87049          1401 ccatgcgattgagcaggtaggtaagaaactgcgcggctatatgacagata   1450 
                                                                                   
    M11689          1451 tgaaacgtattgctgttgcgggttaa   1476                         
                         ||||||||||||||||||||||||||                                
    M87049          1451 tgaaacgtattgctgttgcgggttaa   1476                         
                                                                                   
    

  5. Знакомство с записью гена из эукариотического генома
  6. Идентификационный номер записи EMBL: AL355388 /gene="SSR2"
    Кодирует белки Sw:P23438 Sw:P43308 Sw:Q9CPW5 Sw:Q9CPW5 Sw:Q9CPW5 Sw:Q9CPW5 Sw:Q9CPW5 Tr:Q90Z39 Tr:Q98SP1

    • Структура транслируемых участков гена SSR2 (только первый и последний транслируемые участки).

      Ген на комплементарной цепи:

      <-[103220..103330]--...--[114568..114624]----
    • Общее число экзонов в гене-6
    • Длина самого длинного интрона-3200 н.п.
    • Длина самого короткого интрона-720 н.п.
    • Длина самого длинного экзона-155 н.п.
    • Длина самого короткого экзона-57 н.п.
    Длины посчитаны с помощью Excel (таблица - "/home/students/y06/pozdyshev/Term3/Practice2/intr_ekz.xls)

Назад

На главную

© Поздышев Д.