Была выдана последовательность ДНК E.coli, находящаяся перед генами, регулирующимися белком PurR(пуриновый репрессор).
Необходимо установить следующие параметры для MEME:
* распределение количества встреч каждого мотива:"Zero or one per sequence" * максимальная и минимальная длина мотива: по 16 (ищем мотивы строго заданной длины) * число различных мотивов: 1Полученный LOGO :
Таблица найденных мотивов:
Name | STRAND | START | P-VALUE |
purM | - | 121 | 7.38e-10 |
cvpA | - | 129 | 1.07e-09 |
pyrC | + | 132 | 2.68e-09 |
purE | - | 114 | 3.10e-09 |
purR | + | 138 | 3.79e-08 |
codB | - | 118 | 8.17e-08 |
purL | - | 109 | 2.31e-07 |
guaB | + | 130 | 5.10e-07 |
purA | + | 77 | 6.97e-07 |
glnB | + | 116 | 9.37e-07 |
carA | + | 90 | 4.13e-06 |
rbsD | + | 125 | 5.59e-06 |
folD | + | 5 | 7.59e-06 |
Матрица PSSM (матрица подсчета для определенных положений):
основания \ номера позиций мотива | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
A | 131 | 173 | 15 | -1035 | 95 | 173 | 173 | 114 | -1035 | -185 | -85 | -1035 | -1035 | -85 | -1035 | -27 |
C | -1035 | -1035 | -153 | -1035 | 106 | -153 | -1035 | -53 | 217 | -1035 | -1035 | -1035 | -1035 | 6 | 193 | 6 |
G | 47 | -1035 | 79 | 193 | -1035 | -1035 | -153 | -1035 | -1035 | 206 | 6 | -1035 | -1035 | 106 | -53 | 128 |
T | -1035 | -185 | -27 | -85 | -1035 | -1035 | -1035 | -27 | -1035 | -1035 | 114 | 184 | 184 | -85 | -1035 | -1035 |
Множество нуклеотидов, дающих положительный вес матрицы | R | A | R | G | M | A | A | A | C | G | K | T | T | S | C | S |
Выделим подчеркиванием в заданных последовательностях найденные мотивы:
>codB catgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg >purE tggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc >pyrC gcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta >purR ttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa >cvpA cgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat >purM atattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttuccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag >guaB actaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc >glnB aactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc >purL aggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt >purA accaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaa >folD caaggaaataaatcagttccagatttacaacgccatcatggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcaccttcgcaagaggtcgcttcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgatctacgtaacagatggaatcctctctctg >carA tgtcgcttaatgcctgtaaaacatgcatgagccacaaaataatataaaaaatcccgccattaagttgacttttagcgcccatatctccagaatgccgccgtttgccagaaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatattctctggagggtgttt >rbsD cgtgcaccagatcaatttgaaatcccgccaaacagggttatcgaactgggtactcaggtcgaaatctaacgccagacgcctcctttcttcataagggggcgtttttgttttcatggttaatcaccatgtaaaacgtttcgaggttgatcacatttccgtaacgtcacgatggttttcccaactcagtcaggattaaactg
MEME не всегда точно предсказывал границы сайтов узнавания, так в случае codB, purE, purC, purR, cvpA, purM, guaB, glnB, purL, он ошибся на один нуклеотид, и только в случае purA он полностью с границами узнавания. Так же MEME обнаружил еще последовательности,не входящие в реальные сайты узнавания - folD, carA, rbsD. Получилось, что:
Чувствительность - 0.9 Специфичность - 0.69На начальную страницу