Учебный сайт Смирновой Виктории

Главная Проекты Семестры


Cигналы в нуклеотидных последовательностях


Последовательность ДНК E.coli, находящейся перед генами, регулируемыми белком PurR (пуриновым репрессором).

  1. С помощью сервера MEME, был проведен поиск общего мотива в предложенных последовательностях (предполагаемый сигнал, узнаваемый белком PurR).

    Параметры поиска MEME:

    • распределение количества встреч каждого мотива:"Zero or one per sequence"
    • максимальная и минимальная длина мотива: 16
    • число различных мотивов: 1




    PSSM

    A C G T
    1 -997 157 -23 -140 C
    2 -997 -997 209 -997 G
    3 59 35 -123 -41 M
    4 191 -997 -997 -997 A
    5 191 -997 -997 -997 A
    6 118 35 -997 -140 M
    7 -997 209 -997 -997 C
    8 -997 -997 209 -997 G
    9 18 -997 -997 140 W
    10-997 -997 -997 191 T
    11-997 -997 -997 191 T
    12-997 -997 157 18 K
    13-997 194 -123 -997 C
    14-41 77 -123 18 S
    15-997 -997 -997 191 T
    16-997 -23 -23 118 T

    Таблица найденных мотивов

    NAME STRAND START P-VALUE SITES
    purM + 171 1.25e-09 AAAGCAGTCT CGCAAACGTTTGCTTT CCCTGTTAGA
    codB + 168 5.66e-09 TATTTCCCCA CGAAAACGATTGCTTT TTATCTTCAG
    cvpA + 179 1.09e-08 GAAATCCCTA CGCAAACGTTTTCTTT TTCTGTTAGA
    purE + 164 1.24e-08 TTCACAGCCA CGCAACCGTTTTCCTT GCTCTCTTTC
    purR - 188 2.04e-08 AAAATCGCAA GGTAAACGTTTGCCTT TACACACCTT
    pyrC - 182 3.34e-08 AAAGGATAAG CGGAAACGTTTTCCTT TGCACGAAAA
    purL - 157 5.90e-08 GATGCGCTGA CGAAACCGTTTGCGTG GAAATAAAAT
    guaB - 180 1.47e-07 TTATACAGAG CGTAACCGATTGCATC TACCCCTTTT
    purA + 129 3.53e-07 TACATGTTGA GGAAAACGATTGGCTG AACAAAAAAC
    glnB - 166 4.08e-07 ATTCATTCCT TGAAATCGTTTGCATC CAGCTCGTGT

     
    
    В исходных последовательностях подчеркнуты сайты, найденные MEME, красным выделены реальные сайты связывания:
    
    >codB
    tacggacctgaaccgtaggtcggataaggcgctcgcgtcgcatccgacaccatgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcgtgtcgcaagataacaactttagccaggggccagtcccgcagtcggcgcgg
                                                                                                                                                                                                 
    >purE
    tcgcccggcggtgcatgaacttatcgccaatcagcaacctgcttttcgcgtggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgcatgtcttcccgcaataatccggcgcgtgtcgccatcgtgatggggtccaa
                                                                                                                                                                          
    >pyrC
    gaaccaggcattacgcaattactttaaccagcaacctgcttacgtcctgcgcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagattaatgactgcaccatcccaggtattaaagatccgccgcccagacgactggca
                                                                                                                                                                                             
    >purR
    ttacacactgtgatgaaaaaatctcccgtcatttataatgataagtgtttttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaatggcaacaataaaagatgtagcgaaacgagcaaacgtttccactacaact
                                                                                                                                                                                                                          
    >cvpA
    tgcctgatgcgacgctggcgcgtcttatcaggcctacgcaggggtagaaccgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacatatggtctggattgattacgccataatcgcggtgattgctttttcctctct
                                                                                                                                                                                       
    >purM
    ttttcgttgactttagtcaaaatgataacggtttgagataaagttattttatattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcagtgaccgataaaacctctcttagctacaaagatgccggtgttgatattgac
                                                                                                                                                                               
    >guaB
    acctgtcccatctcatgctcaagcagcagacgaaccgtttgattcaggcgactaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgcccatgctacgtatcgctaaagaagctctgacgtttgacgacgttctcctcgt
                                                                                                                                                                                        
    >glnB
    gggtgaaaatacggcgctgccaacctttgttgaggcacgtaatcagtttgaactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagcatgaaaaagattgatgcgattataaaacccttcaagctggacgatgtccg
                                                                                                                                                                             
    >purL
    attctctgtgtcgtgcgcgtcccagcttgaaaaaacgtaataatagtgaaaggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagacttatgatggaaattctgcgtggttcgcctgcactgtcggcattccgaatcaa
                                                                                                                                                                     
    >purA
    tagggccgatgctttacccgaaggcatggaagaagatgatctctgcgatgaccaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaatgggtaacaacgtcgtcgtactgggcacccaatggggtgacgaaggtaaa
                                                                                                                                                                                                                                           
    
  2. Сравннение результатов с реальными сайтами узнавания PurR.

    • чувствительность (отношение числа правильных предсказаний к числу реальных сайтов)........ 0,9
    • специфичность отношение числа правильных предсказаний к общему числу предсказаний (правильных и неправильных).........0,9
    • Во всех случаях правильных предсказаний (предсказанный сайт пересекается с реальным >, чем на 8 нуклеотидов) координаты предсказанного сайта были сдвинуты на 1 относительно реальных (влево для прямой цепи, вправо для обратной). В одном случае сайт был предсказан неправильно, достаточно далеко от реального.



© Smirnova Victoriya, 2009