Мне был дан файл с последовательностями ДНК E.coli, находящимися перед генами, регулируемыми белком PurR (пуриновым репрессором). Я воспользовалась сервером MEME для поиска общих мотивов в предложенных последовательностях (предполагаемый сигнал, узнаваемый белком PurR).
На страничке сервера я ввела свой электронный адрес и вставила свои последовательности в специальное поле. Также я установила следующие параметры:
LOGO
PSSM
№ позиций | A | C | G | T | Положительный вклад |
1 | 163 | -1010 | -37 | -1010 | A |
2 | -54 | 95 | -37 | -54 | C |
3 | -1010 | -137 | 195 | -1010 | G |
4 | -1010 | 195 | -137 | -1010 | C |
5 | 192 | -1010 | -1010 | -1010 | A |
6 | 192 | -1010 | -1010 | -1010 | A |
7 | 104 | -137 | -1010 | 46 | W |
8 | -1010 | 209 | -1010 | -1010 | C |
9 | -1010 | -1010 | 209 | -1010 | G |
10 | -154 | -1010 | -37 | 146 | T |
11 | -1010 | -1010 | -1010 | 192 | T |
12 | -1010 | -1010 | -1010 | 192 | T |
13 | -54 | -1010 | -137 | 146 | T |
14 | -154 | 195 | -1010 | -1010 | C |
15 | -154 | 95 | 63 | -154 | S |
16 | -54 | -37 | -1010 | 127 | T |
Таблица найденных мотивов
Имя последовательности | Направление цепи | Координата первого нуклеотида |
purL | + | 208 |
purE | + | 213 |
codB | - | 217 |
cvpA | + | 228 |
purR | + | 239 |
purA | - | 178 |
pyrC | - | 233 |
purM | - | 220 |
folD | - | 321 |
guaB | + | 231 |
glnB | + | 217 |
Исходные последовательности, в которых подчёркнуты найденные мотивы:
>codB cggcactgtgtgccgatgcctgatgcgacgctgacgcgttttatcatgcctacggacctgaaccgtaggtcggataaggcgctcgcgtcgcatccgacaccatgctcagatgcctgatgcgacgctgacgcgtctСравнение результатов с реальными сайтами узнавания PurR.
gtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggat
tttttgggtttcaaacagcaaaaagggggaatttcgtgtcgcaagataacaactttagccaggggccagtcccgcagtcggcgcggaaaggggtattggcattgacgttcgtcatgctgggattaaccttcttttc >purE agtgcgatggaaaaacatcaggtgcaatggctgatccacgggcatacccatcgcccggcggtgcatgaacttatcgccaatcagcaacctgcttttcgcgtggtactgggtgcctggcatacggaaggttcaatg
gtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctcta
aagccgagagttgtgcaccacaggagttttaagacgcatgtcttcccgcaataatccggcgcgtgtcgccatcgtgatggggtccaaaagcgactgggctaccatgcagttcgccgccgaaatcttcgaaatcctga >pyrC gtacaaccggaaaaaatgcaaacggtgatgcaaacgttgcttccctatttgaaccaggcattacgcaattactttaaccagcaacctgcttacgtcctgcgcgaagatggcagccagggcgaagcaatggcgaaa
aaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtc
cggcaaaaacatcccttcagccggagcatagagattaatgactgcaccatcccaggtattaaagatccgccgcccagacgactggcaccttcacctccgcgatggcgacatgttaaaaactgtcgtgccatatacca >purR tcaagttttctccttttttattaccacacaaaaagtgatattacgcatttttacacactgtgatgaaaaaatctcccgtcatttataatgataagtgtttttaccacttccccttttcgtcaagatcggccaaaa
ttccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattt
tgcaggagctgaagttagggtctggagtgaaatggaatggcaacaataaaagatgtagcgaaacgagcaaacgtttccactacaactgtgtcacacgtgatcaacaaaacacgtttcgtcgctgaagaaacgcgcaa >cvpA tctggcttaagtggcgtggtaatgggctatacgccgaattaatacggtcttgcctgatgcgacgctggcgcgtcttatcaggcctacgcaggggtagaaccgtaggtcggataaggcgtttacgccgcatccgac
acgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccc
cgaacaggatgacagggcgtaaaatcgtgggacacatatggtctggattgattacgccataatcgcggtgattgctttttcctctctggttagcctgatccgcggctttgttcgtgaagcgttatcgctggtgacat >purM acaaaaaaaatcgacggattatacctcctttcttcaaggcggcaatattcttttcgttgactttagtcaaaatgataacggtttgagataaagttattttatattcagatggttatgaaagaagattattccatcc
gaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatt
tttctaccgcaagtaacgcgtggggacccaagcagtgaccgataaaacctctcttagctacaaagatgccggtgttgatattgacgcgggtaatgctctggttggaagaatcaaaggcgtagtgaagaaaacgcg >guaB agtgaccggaagctggttgcgtgaaattagaaatttcgccgctgatccaaacctgtcccatctcatgctcaagcagcagacgaaccgtttgattcaggcgactaacggtaaaaattgcaggggattgagaaggtaa
catgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggc
aatatttattaaccactctggtcgagatattgcccatgctacgtatcgctaaagaagctctgacgtttgacgacgttctcctcgttcctgctcactctaccgttctgccgaatactgctgacctcagcacccagc >glnB ctgacctcatctccggtgattagtgatgcgctggtggagcaggcgctggagggtgaaaatacggcgctgccaacctttgttgaggcacgtaatcagtttgaactcaactatttgcgtaagctgctgcaaatcacc
aaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgttta
gcagatcaaaagacaggcgaccttttcaaggaatagcatgaaaaagattgatgcgattataaaacccttcaagctggacgatgtccgcgaagcactggccgaagtcggtattaccggcatgacggtgaccgaagtga >purL ccagaatgccgatgaacagataattaatctttaattttttcaattagttaattctctgtgtcgtgcgcgtcccagcttgaaaaaacgtaataatagtgaaaggtttactcataaatgagcggcattttgcgtaaac
ctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttccccccc
ttgggtacaccgaaagcttagaagacgagagacttatgatggaaattctgcgtggttcgcctgcactgtcggcattccgaatcaacaaactgctggcacgttttcaggctgccaggctcccggttcacaatattt >purA gaattcgacaatctggctggcgcttgccctggttttggtactggaaggtttagggccgatgctttacccgaaggcatggaagaagatgatctctgcgatgaccaatttgcccgataatattttacgtcgttttggc
ggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggta
gaatccatttttaagcaaacggtgattttgaaaaatgggtaacaacgtcgtcgtactgggcacccaatggggtgacgaaggtaaaggtaagatcgtcgatcttctgactgaacgggctaaatatgttgtacgcta >folD aaatatattcaacacaaatatagacctgaagcggtaaattaccaggctgaaaattctttttatattgtcaggtatttcttaaattatcttaatccttagacaaggaaataaatcagttccagatttacaacgccat
catggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcaccttcgcaagaggtcgcttcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgat
ctacgtaacagatggaatcctctctctgatggcagcaaagattattgacggtaaaacgattgcgcagcaggtgcgctctgaagttgctcaaaaagttcaggcgcgtattgcagccggactgcgggcac
MEME нашёл мотивы во всех заданных последовательностях. Но в одном случае координаты предсказанного сайта не совпали с реальным (purA).
Чувствительность: число прав. предсказ./число реальных сайтов (9/10=0.9).
Специфичность: число прав. предсказ./общее число предсказ. (9/11=0.81).