Занятие 2. Банк EMBL

  1. Сравнение разных записей в EMBL
  2. C помощью SRS я получила информацию, необходимую для заполнения следующей таблицы.

Идентификатор записиEMBL ID Тип молекулы Класс данных Раздел EMBL Длина последовательности Дата создания документа Описание
  EMBL:AP009048 AP009048
genomic DNA
STD
PRO
4646332
22-JAN-2006
Escherichia coli W3110 DNA, complete genome.
  EMBL:U00096 U00096
genomic DNA
STD
PRO
4639675
23-FEB-2006
Escherichia coli K12 MG1655, complete genome.
  EMBL:U14003 U14003
genomic DNA
STD
PRO
338534
30-NOV-1994
Escherichia coli K-12 chromosomal region from 92.8 to 00.1 minutes.
  EMBL:X00742 X00742
genomic DNA
STD
PRO
358
07-NOV-1985
E. coli deoA-deoB intercistronic region with internal regulated promoter (deoP3)
  EMBL:X03224 X03224
genomic DNA
STD
PRO
1718
28-JAN-1986
Escherichia coli deoC gene for 2-deoxyribose 5-phosphate aldolase and deoA gene 5' region

С увеличением даты создания повышается и длина последовательности, причем разница между 85 и 86 годами- в 5 раз, а между 86 и 94- в 500 раз.2 из 5 последовательностей- полные геномы.

  • Сравнение описаний гена Escherichia coli в двух разных записях EMBL
  • На основании результатов упр.1 я выбрала 2 записи для дальнейшего изучения (специально не брала полные геномы). Получила эти записи EMBL и убедилась, что в этих документах действительно содержатся описания последовательности, кодирующей мой белок. Изучила документы и заполнила таблицу:

    Последовательности, кодирующие белок 2tpt в двух записях банка EMBL

      I II
    ID записи x00742 x03224
    Начало гена в записи 1 1665
    Конец гена в записи 195 1718
    Направление гена прямое прямое
    Примечания*    

    Эти записи 1985 и 1986 годов, процент идентичности оказался 14.9%,поэтому я решила взять "более" новые данные.
      I II
    ID записи AP009048 U00096
    Начало гена в записи 4622909 4616252
    Конец гена в записи 4624231 4617574
    Направление гена прямое прямое
    Примечания*    

    В этом случае последовательности, кодирующие мой белок в разных записях идентичны на 100%. Выравнивание:

    AP009048           1 ttgtttctcgcacaagaaattattcgtaaaaaacgtgatggtcatgcgct     50
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096             1 ttgtttctcgcacaagaaattattcgtaaaaaacgtgatggtcatgcgct     50
    
    AP009048          51 gagcgatgaagaaattcgtttctttatcaacggtattcgcgacaacacta    100
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096            51 gagcgatgaagaaattcgtttctttatcaacggtattcgcgacaacacta    100
    
    AP009048         101 tctccgaagggcagattgccgccctcgcgatgaccattttcttccacgat    150
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           101 tctccgaagggcagattgccgccctcgcgatgaccattttcttccacgat    150
    
    AP009048         151 atgacaatgcctgagcgtgtctcgctgaccatggcgatgcgagattcagg    200
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           151 atgacaatgcctgagcgtgtctcgctgaccatggcgatgcgagattcagg    200
    
    AP009048         201 aaccgttctcgactggaaaagcctgcatctgaatggcccgattgttgata    250
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           201 aaccgttctcgactggaaaagcctgcatctgaatggcccgattgttgata    250
    
    AP009048         251 aacactccaccggtggcgtcggcgatgtgacttcgctgatgttggggccg    300
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           251 aacactccaccggtggcgtcggcgatgtgacttcgctgatgttggggccg    300
    
    AP009048         301 atggtcgcagcctgcggcggctatattccgatgatctctggtcgcggcct    350
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           301 atggtcgcagcctgcggcggctatattccgatgatctctggtcgcggcct    350
    
    AP009048         351 cggtcatactggcggtacgctcgacaaactggaatccatccctggcttcg    400
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           351 cggtcatactggcggtacgctcgacaaactggaatccatccctggcttcg    400
    
    AP009048         401 acattttcccggatgacaaccgtttccgcgaaattattaaagacgtcggc    450
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           401 acattttcccggatgacaaccgtttccgcgaaattattaaagacgtcggc    450
    
    AP009048         451 gtggcgattatcggtcagaccagttcactggctccggctgataaacgttt    500
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           451 gtggcgattatcggtcagaccagttcactggctccggctgataaacgttt    500
    
    AP009048         501 ctacgcgacccgtgatattaccgcaaccgtggactccatcccgctgatca    550
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           501 ctacgcgacccgtgatattaccgcaaccgtggactccatcccgctgatca    550
    
    AP009048         551 ccgcctctattctggcgaagaaacttgcggaaggtctggacgcgctggtg    600
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           551 ccgcctctattctggcgaagaaacttgcggaaggtctggacgcgctggtg    600
    
    AP009048         601 atggacgtgaaagtgggtagcggcgcgtttatgccgacctacgaactctc    650
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           601 atggacgtgaaagtgggtagcggcgcgtttatgccgacctacgaactctc    650
    
    AP009048         651 tgaagcccttgccgaagcgattgttggcgtggctaacggcgctggcgtgc    700
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           651 tgaagcccttgccgaagcgattgttggcgtggctaacggcgctggcgtgc    700
    
    AP009048         701 gcaccaccgcgctgctcaccgacatgaatcaggtactggcctccagtgca    750
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           701 gcaccaccgcgctgctcaccgacatgaatcaggtactggcctccagtgca    750
    
    AP009048         751 ggtaacgcggttgaagttcgtgaagcggtgcagttcctgacgggtgaata    800
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           751 ggtaacgcggttgaagttcgtgaagcggtgcagttcctgacgggtgaata    800
    
    AP009048         801 tcgtaacccgcgtctgtttgatgtcacgatggcgctgtgcgtggagatgc    850
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           801 tcgtaacccgcgtctgtttgatgtcacgatggcgctgtgcgtggagatgc    850
    
    AP009048         851 tgatctccggcaaactggcgaaagatgacgccgaagcgcgcgcgaaattg    900
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           851 tgatctccggcaaactggcgaaagatgacgccgaagcgcgcgcgaaattg    900
    
    AP009048         901 caggcggtgctggacaacggtaaagcggcagaagtctttggtcgtatggt    950
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           901 caggcggtgctggacaacggtaaagcggcagaagtctttggtcgtatggt    950
    
    AP009048         951 agcggcacaaaaaggcccgaccgacttcgttgagaactacgcgaagtatc   1000
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           951 agcggcacaaaaaggcccgaccgacttcgttgagaactacgcgaagtatc   1000
    
    AP009048        1001 tgccgacagcgatgctgacgaaagcagtctatgctgataccgaaggtttt   1050
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1001 tgccgacagcgatgctgacgaaagcagtctatgctgataccgaaggtttt   1050
    
    AP009048        1051 gtcagtgaaatggatacccgcgcgctggggatggcagtggttgcaatggg   1100
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1051 gtcagtgaaatggatacccgcgcgctggggatggcagtggttgcaatggg   1100
    
    AP009048        1101 cggcggacgccgtcaggcatctgacaccatcgattacagcgtcggcttta   1150
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1101 cggcggacgccgtcaggcatctgacaccatcgattacagcgtcggcttta   1150
    
    AP009048        1151 ctgatatggcgcgtctgggcgaccaggtagacggtcagcgtccgctggcg   1200
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1151 ctgatatggcgcgtctgggcgaccaggtagacggtcagcgtccgctggcg   1200
    
    AP009048        1201 gttatccacgcgaaagacgaaaacaactggcaggaagcggcgaaagcggt   1250
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1201 gttatccacgcgaaagacgaaaacaactggcaggaagcggcgaaagcggt   1250
    
    AP009048        1251 gaaagcggcaattaaacttgccgataaagcaccggaaagcacaccaactg   1300
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1251 gaaagcggcaattaaacttgccgataaagcaccggaaagcacaccaactg   1300
    
    AP009048        1301 tctatcgccgtatcagcgaataa   1323
                         |||||||||||||||||||||||
    U00096          1301 tctatcgccgtatcagcgaataa   1323
        

  • 3.Знакомство с записью гена из эукариотического генома
  • На предыдущую.