Сигналы в нуклеотидных последовательностях.

Была выдана последовательность ДНК E.coli, находящаяся перед генами, регулирующимися белком PurR(пуриновый репрессор).

  1. Пользуясь сервером MEME, найдем общий мотив в предложенных последовательностях (предполагаемый сигнал, узнамаемый белком PurR):

    Необходимо установить следующие параметры для MEME:

        * распределение количества встреч каждого мотива:"Zero or one per sequence"
        * максимальная и минимальная длина мотива: по 16 (ищем мотивы строго заданной длины)
        * число различных мотивов: 1 
    Полученный LOGO :


    Таблица найденных мотивов:

    Name STRAND START P-VALUE
    purM - 121 7.38e-10
    cvpA - 129 1.07e-09
    pyrC + 132 2.68e-09
    purE - 114 3.10e-09
    purR + 138 3.79e-08
    codB - 118 8.17e-08
    purL - 109 2.31e-07
    guaB + 130 5.10e-07
    purA + 77 6.97e-07
    glnB + 116 9.37e-07
    carA + 90 4.13e-06
    rbsD + 125 5.59e-06
    folD + 5 7.59e-06

    Матрица PSSM (матрица подсчета для определенных положений):
    основания \ номера позиций мотива 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
    A 131 173 15 -1035 95 173 173 114 -1035 -185 -85 -1035 -1035 -85 -1035 -27
    C -1035 -1035 -153 -1035 106 -153 -1035 -53 217 -1035 -1035 -1035 -1035 6 193 6
    G 47 -1035 79 193 -1035 -1035 -153 -1035 -1035 206 6 -1035 -1035 106 -53 128
    T -1035 -185 -27 -85 -1035 -1035 -1035 -27 -1035 -1035 114 184 184 -85 -1035 -1035
    Множество нуклеотидов, дающих положительный вес матрицы R A R G M A A A C G K T T S C S

    Выделим подчеркиванием в заданных последовательностях найденные мотивы:

    >codB
    catgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg
    
    >purE
    tggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc
    
    >pyrC
    gcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta
    
    >purR
    ttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa
    
    >cvpA
    cgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat
    
    >purM
    atattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttuccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag
    
    >guaB
    actaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc
    
    >glnB
    aactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc
    
    >purL
    aggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt
    
    >purA
    accaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaa
    
    >folD
    caaggaaataaatcagttccagatttacaacgccatcatggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcaccttcgcaagaggtcgcttcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgatctacgtaacagatggaatcctctctctg
    
    >carA
    tgtcgcttaatgcctgtaaaacatgcatgagccacaaaataatataaaaaatcccgccattaagttgacttttagcgcccatatctccagaatgccgccgtttgccagaaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatattctctggagggtgttt
    
    >rbsD
    cgtgcaccagatcaatttgaaatcccgccaaacagggttatcgaactgggtactcaggtcgaaatctaacgccagacgcctcctttcttcataagggggcgtttttgttttcatggttaatcaccatgtaaaacgtttcgaggttgatcacatttccgtaacgtcacgatggttttcccaactcagtcaggattaaactg
     
  2. Сравним полученные результаты с реальными сайтами узнавания PurR.

    MEME не всегда точно предсказывал границы сайтов узнавания, так в случае codB, purE, purC, purR, cvpA, purM, guaB, glnB, purL, он ошибся на один нуклеотид, и только в случае purA он полностью с границами узнавания. Так же MEME обнаружил еще последовательности,не входящие в реальные сайты узнавания - folD, carA, rbsD. Получилось, что:

    Чувствительность - 0.9
    Специфичность - 0.69          
              
    На начальную страницу

    ©Пискунова Юлия 2009