Мне был дан файл с последовательностями ДНК E.coli, находящимися перед генами, регулируемыми белком PurR (пуриновым репрессором). Я воспользовалась сервером MEME для поиска общих мотивов в предложенных последовательностях (предполагаемый сигнал, узнаваемый белком PurR).
На страничке сервера я ввела свой электронный адрес и вставила свои последовательности в специальное поле. Также я установила следующие параметры:
LOGO
PSSM
| № позиций | A | C | G | T | Положительный вклад |
| 1 | 163 | -1010 | -37 | -1010 | A |
| 2 | -54 | 95 | -37 | -54 | C |
| 3 | -1010 | -137 | 195 | -1010 | G |
| 4 | -1010 | 195 | -137 | -1010 | C |
| 5 | 192 | -1010 | -1010 | -1010 | A |
| 6 | 192 | -1010 | -1010 | -1010 | A |
| 7 | 104 | -137 | -1010 | 46 | W |
| 8 | -1010 | 209 | -1010 | -1010 | C |
| 9 | -1010 | -1010 | 209 | -1010 | G |
| 10 | -154 | -1010 | -37 | 146 | T |
| 11 | -1010 | -1010 | -1010 | 192 | T |
| 12 | -1010 | -1010 | -1010 | 192 | T |
| 13 | -54 | -1010 | -137 | 146 | T |
| 14 | -154 | 195 | -1010 | -1010 | C |
| 15 | -154 | 95 | 63 | -154 | S |
| 16 | -54 | -37 | -1010 | 127 | T |
Таблица найденных мотивов
| Имя последовательности | Направление цепи | Координата первого нуклеотида |
| purL | + | 208 |
| purE | + | 213 |
| codB | - | 217 |
| cvpA | + | 228 |
| purR | + | 239 |
| purA | - | 178 |
| pyrC | - | 233 |
| purM | - | 220 |
| folD | - | 321 |
| guaB | + | 231 |
| glnB | + | 217 |
Исходные последовательности, в которых подчёркнуты найденные мотивы:
>codB cggcactgtgtgccgatgcctgatgcgacgctgacgcgttttatcatgcctacggacctgaaccgtaggtcggataaggcgctcgcgtcgcatccgacaccatgctcagatgcctgatgcgacgctgacgcgtctСравнение результатов с реальными сайтами узнавания PurR.
gtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggat
tttttgggtttcaaacagcaaaaagggggaatttcgtgtcgcaagataacaactttagccaggggccagtcccgcagtcggcgcggaaaggggtattggcattgacgttcgtcatgctgggattaaccttcttttc >purE agtgcgatggaaaaacatcaggtgcaatggctgatccacgggcatacccatcgcccggcggtgcatgaacttatcgccaatcagcaacctgcttttcgcgtggtactgggtgcctggcatacggaaggttcaatg
gtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctcta
aagccgagagttgtgcaccacaggagttttaagacgcatgtcttcccgcaataatccggcgcgtgtcgccatcgtgatggggtccaaaagcgactgggctaccatgcagttcgccgccgaaatcttcgaaatcctga >pyrC gtacaaccggaaaaaatgcaaacggtgatgcaaacgttgcttccctatttgaaccaggcattacgcaattactttaaccagcaacctgcttacgtcctgcgcgaagatggcagccagggcgaagcaatggcgaaa
aaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtc
cggcaaaaacatcccttcagccggagcatagagattaatgactgcaccatcccaggtattaaagatccgccgcccagacgactggcaccttcacctccgcgatggcgacatgttaaaaactgtcgtgccatatacca >purR tcaagttttctccttttttattaccacacaaaaagtgatattacgcatttttacacactgtgatgaaaaaatctcccgtcatttataatgataagtgtttttaccacttccccttttcgtcaagatcggccaaaa
ttccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattt
tgcaggagctgaagttagggtctggagtgaaatggaatggcaacaataaaagatgtagcgaaacgagcaaacgtttccactacaactgtgtcacacgtgatcaacaaaacacgtttcgtcgctgaagaaacgcgcaa >cvpA tctggcttaagtggcgtggtaatgggctatacgccgaattaatacggtcttgcctgatgcgacgctggcgcgtcttatcaggcctacgcaggggtagaaccgtaggtcggataaggcgtttacgccgcatccgac
acgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccc
cgaacaggatgacagggcgtaaaatcgtgggacacatatggtctggattgattacgccataatcgcggtgattgctttttcctctctggttagcctgatccgcggctttgttcgtgaagcgttatcgctggtgacat >purM acaaaaaaaatcgacggattatacctcctttcttcaaggcggcaatattcttttcgttgactttagtcaaaatgataacggtttgagataaagttattttatattcagatggttatgaaagaagattattccatcc
gaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatt
tttctaccgcaagtaacgcgtggggacccaagcagtgaccgataaaacctctcttagctacaaagatgccggtgttgatattgacgcgggtaatgctctggttggaagaatcaaaggcgtagtgaagaaaacgcg >guaB agtgaccggaagctggttgcgtgaaattagaaatttcgccgctgatccaaacctgtcccatctcatgctcaagcagcagacgaaccgtttgattcaggcgactaacggtaaaaattgcaggggattgagaaggtaa
catgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggc
aatatttattaaccactctggtcgagatattgcccatgctacgtatcgctaaagaagctctgacgtttgacgacgttctcctcgttcctgctcactctaccgttctgccgaatactgctgacctcagcacccagc >glnB ctgacctcatctccggtgattagtgatgcgctggtggagcaggcgctggagggtgaaaatacggcgctgccaacctttgttgaggcacgtaatcagtttgaactcaactatttgcgtaagctgctgcaaatcacc
aaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgttta
gcagatcaaaagacaggcgaccttttcaaggaatagcatgaaaaagattgatgcgattataaaacccttcaagctggacgatgtccgcgaagcactggccgaagtcggtattaccggcatgacggtgaccgaagtga >purL ccagaatgccgatgaacagataattaatctttaattttttcaattagttaattctctgtgtcgtgcgcgtcccagcttgaaaaaacgtaataatagtgaaaggtttactcataaatgagcggcattttgcgtaaac
ctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttccccccc
ttgggtacaccgaaagcttagaagacgagagacttatgatggaaattctgcgtggttcgcctgcactgtcggcattccgaatcaacaaactgctggcacgttttcaggctgccaggctcccggttcacaatattt >purA gaattcgacaatctggctggcgcttgccctggttttggtactggaaggtttagggccgatgctttacccgaaggcatggaagaagatgatctctgcgatgaccaatttgcccgataatattttacgtcgttttggc
ggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggta
gaatccatttttaagcaaacggtgattttgaaaaatgggtaacaacgtcgtcgtactgggcacccaatggggtgacgaaggtaaaggtaagatcgtcgatcttctgactgaacgggctaaatatgttgtacgcta >folD aaatatattcaacacaaatatagacctgaagcggtaaattaccaggctgaaaattctttttatattgtcaggtatttcttaaattatcttaatccttagacaaggaaataaatcagttccagatttacaacgccat
catggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcaccttcgcaagaggtcgcttcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgat
ctacgtaacagatggaatcctctctctgatggcagcaaagattattgacggtaaaacgattgcgcagcaggtgcgctctgaagttgctcaaaaagttcaggcgcgtattgcagccggactgcgggcac
MEME нашёл мотивы во всех заданных последовательностях. Но в одном случае координаты предсказанного сайта не совпали с реальным (purA).
Чувствительность: число прав. предсказ./число реальных сайтов (9/10=0.9).
Специфичность: число прав. предсказ./общее число предсказ. (9/11=0.81).