Скачав свой файл с последовательностями ДНК E.coli, находящимися перед генами, регулируемыми белком PurR (пуриновым репрессором), я зашёл на сервер MEME для поиска общих мотивов в предложенных последовательностях (предполагаемый сигнал, узнаваемый белком PurR).
На страничке я ввёл свой электронный адрес, загрузил свой файл с последовательностями и установил следующие параметры:
- распределение количества встреч каждого мотива:"Zero or one per sequence"
- максимальная и минимальная длина мотива: по 16 (ищем мотивы строго заданной длины)
- число различных мотивов: 1
LOGO
PSSM
| №№ позиций | A | C | G | T | Положительный вклад |
| 1 | -173 | 174 | -142 | -173 | C |
| 2 | -1023 | -1023 | 203 | -173 | G |
| 3 | -73 | 90 | -43 | -14 | C |
| 4 | 186 | -1023 | -1023 | -1023 | A |
| 5 | 186 | -1023 | -1023 | -1023 | A |
| 6 | 108 | 16 | -1023 | -73 | M |
| 7 | -173 | 203 | -1023 | -1023 | C |
| 8 | -1023 | -1023 | 216 | -1023 | G |
| 9 | -14 | -142 | -43 | 86 | T |
| 10 | -1023 | -1023 | -1023 | 186 | T |
| 11 | -1023 | -1023 | -43 | 159 | T |
| 12 | -173 | -1023 | 116 | 59 | K |
| 13 | -173 | 174 | -1023 | -73 | C |
| 14 | -14 | 16 | -142 | 59 | C |
| 15 | -1023 | -1023 | -1023 | 186 | T |
| 16 | -1023 | 57 | -1023 | 127 | Y |
Таблица найденных мотивов
| Имя последовательности | Направление цепи | Координата первого нуклеотида |
| purM | + | 21 |
| cvpA | + | 29 |
| purE | + | 14 |
| pyrC | - | 32 |
| codB | + | 18 |
| guaB | - | 30 |
| purL | + | 9 |
| purR | - | 38 |
| glnB | - | 16 |
| purA | + | 78 |
| rpiA | + | 41 |
| folD | + | 75 |
Учитывая эти данные, можно обозначить найденные мотивы в последовательностях:
>codB aaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatag aatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg >purE tgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctc tgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc >pyrC agggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgctta tcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta >purR ggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttacc ttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa >cvpA tttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgtt agaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat >purM aaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgc gccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag >guaB gatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgt ataatgccgcggcaatatttattaaccactctggtcgagatattgccc >glnB ttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatg tgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc >purL ttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgc ccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt >purA aaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcg atggtagaatccatttttaagcaaacggtgattttgaaaaa >folD tcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcg catccccttcgatctacgtaacagatggaatcctctctctg >rpiA tattttatggatgagttaaccacgcggcttgccaacggggtctgaatcgcttttttt gtatataatgcgtgtgaaatttcataccacaggcgaaacgatcСравнение результатов с реальными сайтами узнавания PurR.
MEME нашёл мотивы во всех заданных последовательностях, все предсказания верны. Хотя во всех случаях координаты предсказанного сайта немного отличались от реального.
Чувствительность: 1.
Специфичность: 1.