Cигналы в нуклеотидных последовательностях

  1. Определение общего мотива в предложенных последовательностях.

    Пользуясь сервером MEME, были найдены общие мотивы в предложенных последовательностях * (предполагаемый сигнал, узнаваемый белком PurR). Установив необходимые параметры и запустив программу, были получены предсказания мативов. Их анализ представлен ниже.

    Logo:

    PSSM:

    A C G T pattern
    1 -1035 159 0 -181 C
    2 -1035 -1035 212 -1035 G
    3 51 74 -158 -81 M
    4 189 -1035 -1035 -1035 A
    5 189 -1035 -1035 -1035 A
    6 100 0 -58 -181 A
    7 -181 188 -158 -1035 C
    8 -1035 -1035 212 -1035 G
    9 -22 -1035 0 100 C
    10 -181 -151 100 165 T
    11 -1035 -158 -158 165 T
    12 -1035 -1035 174 -22 G
    13 -1035 200 -158 -1035 C
    14 -22 74 -158 19 Y
    15 -1035 -1035 -1035 189 T
    16 -1035 0 0 100 T

    Таблица найденных мотивов:
    Имя последовательности Цепь (+/-) координата первого нуклеотида P-VALUE
    purM + 121 5.65e-09
    codB + 118 1.54e-08
    purE - 113 5.41e-08
    purR - 139 6.18e-08
    purL - 108 8.22e-08
    cvpA + 129 9.73e-08
    guaB - 131 4.75e-07
    pyrC - 133 4.75e-07
    purA + 79 7.18e-07
    glnB - 117 1.61e-06
    carA - 91 4.09e-06
    rpiA + 73 4.78e-06
    folD + 86 5.87e-06



    Ниже приведены исходные последовательности.
    В последовательностях, содержащих один из найденных мотивов, этот мотив подчёркнут.

    
    >codB
    catgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttac
    accgataatttttcccccacctttttgcactcattcatataaaaaatatatttccccacg
    aaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaac
    agcaaaaagggggaatttcg
    
    >purE
    tggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttg
    agctgattcattttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaac
    cgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgca
    ccacaggagttttaagacgc
    
    >pyrC
    gcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtga
    agccaggcgaaattgtcattccatttactgattaatcacgagggcgcattcgcgcccttt
    atttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatccctt
    cagccggagcatagagatta
    
    >purR
    ttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtac
    tggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttg
    ttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagtta
    gggtctggagtgaaatggaa
    
    >cvpA
    cgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggc
    ataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaagg
    aaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacaggg
    cgtaaaatcgtgggacacat
    
    >purM
    atattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcac
    aagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtc
    tcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagta
    acgcgtggggacccaagcag
    
    >guaB
    actaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaa
    atcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgca
    aaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaacca
    ctctggtcgagatattgccc
    
    >glnB
    aactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcga
    gaatggcggggcgcaaccggacagaattttataaactgctttcccgacacgagctggatg
    caaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacagg
    cgaccttttcaaggaatagc
    
    >purL
    aggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattac
    agccattggcggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtt
    tcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaa
    gcttagaagacgagagactt
    
    >purA
    accaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgtt
    gtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtc
    atttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaag
    caaacggtgattttgaaaaa
    
    >folD
    caaggaaataaatcagttccagatttacaacgccatcatggacgaaaaatgaagctttca
    gtctcagcgacggtgcgcctcaccttcgcaagaggtcgcttcacgcgataaatctgaaac
    gaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgatctacgtaa
    cagatggaatcctctctctg
    
    >rpiA
    gaacggtgaactggtgcgcctgtttgcaccgtggagcggcatacccagaccgttgtatgc
    tttatttgcggggcgaaaggggatgcctgccattgcgcgatattttatggatgagttaac
    cacgcggcttgccaacggggtctgaatcgctttttttgtatataatgcgtgtgaaatttc
    ataccacaggcgaaacgatc
    
    >carA
    tgtcgcttaatgcctgtaaaacatgcatgagccacaaaataatataaaaaatcccgccat
    taagttgacttttagcgcccatatctccagaatgccgccgtttgccagaaattcgtcggt
    aagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtga
    atattctctggagggtgttt
    
    

  2. Сравнивание результатов с реальными сайтами узнавания PurR.

    Почти все мотивы были найдены верно,  за исключением трех неверно найденных: folD, rpiA, carA. В связи с этим,  чувствительность = 10/10 = 1.00, специфичность = 10/13 = 0.77