Главная | Проекты | Семестры |
Последовательность ДНК E.coli, находящейся перед генами, регулируемыми белком PurR (пуриновым репрессором).
- С помощью сервера MEME, был проведен поиск общего мотива в предложенных последовательностях (предполагаемый сигнал, узнаваемый белком PurR).
Параметры поиска MEME:
- распределение количества встреч каждого мотива:"Zero or one per sequence"
- максимальная и минимальная длина мотива: 16
- число различных мотивов: 1
PSSM
A C G T 1 -997 157 -23 -140 C 2 -997 -997 209 -997 G 3 59 35 -123 -41 M 4 191 -997 -997 -997 A 5 191 -997 -997 -997 A 6 118 35 -997 -140 M 7 -997 209 -997 -997 C 8 -997 -997 209 -997 G 9 18 -997 -997 140 W 10 -997 -997 -997 191 T 11 -997 -997 -997 191 T 12 -997 -997 157 18 K 13 -997 194 -123 -997 C 14 -41 77 -123 18 S 15 -997 -997 -997 191 T 16 -997 -23 -23 118 T
Таблица найденных мотивов
NAME STRAND START P-VALUE SITES purM + 171 1.25e-09 AAAGCAGTCT CGCAAACGTTTGCTTT CCCTGTTAGA codB + 168 5.66e-09 TATTTCCCCA CGAAAACGATTGCTTT TTATCTTCAG cvpA + 179 1.09e-08 GAAATCCCTA CGCAAACGTTTTCTTT TTCTGTTAGA purE + 164 1.24e-08 TTCACAGCCA CGCAACCGTTTTCCTT GCTCTCTTTC purR - 188 2.04e-08 AAAATCGCAA GGTAAACGTTTGCCTT TACACACCTT pyrC - 182 3.34e-08 AAAGGATAAG CGGAAACGTTTTCCTT TGCACGAAAA purL - 157 5.90e-08 GATGCGCTGA CGAAACCGTTTGCGTG GAAATAAAAT guaB - 180 1.47e-07 TTATACAGAG CGTAACCGATTGCATC TACCCCTTTT purA + 129 3.53e-07 TACATGTTGA GGAAAACGATTGGCTG AACAAAAAAC glnB - 166 4.08e-07 ATTCATTCCT TGAAATCGTTTGCATC CAGCTCGTGT
В исходных последовательностях подчеркнуты сайты, найденные MEME, красным выделены реальные сайты связывания: >codB tacggacctgaaccgtaggtcggataaggcgctcgcgtcgcatccgacaccatgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcgtgtcgcaagataacaactttagccaggggccagtcccgcagtcggcgcgg >purE tcgcccggcggtgcatgaacttatcgccaatcagcaacctgcttttcgcgtggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgcatgtcttcccgcaataatccggcgcgtgtcgccatcgtgatggggtccaa >pyrC gaaccaggcattacgcaattactttaaccagcaacctgcttacgtcctgcgcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagattaatgactgcaccatcccaggtattaaagatccgccgcccagacgactggca >purR ttacacactgtgatgaaaaaatctcccgtcatttataatgataagtgtttttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaatggcaacaataaaagatgtagcgaaacgagcaaacgtttccactacaact >cvpA tgcctgatgcgacgctggcgcgtcttatcaggcctacgcaggggtagaaccgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacatatggtctggattgattacgccataatcgcggtgattgctttttcctctct >purM ttttcgttgactttagtcaaaatgataacggtttgagataaagttattttatattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcagtgaccgataaaacctctcttagctacaaagatgccggtgttgatattgac >guaB acctgtcccatctcatgctcaagcagcagacgaaccgtttgattcaggcgactaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgcccatgctacgtatcgctaaagaagctctgacgtttgacgacgttctcctcgt >glnB gggtgaaaatacggcgctgccaacctttgttgaggcacgtaatcagtttgaactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagcatgaaaaagattgatgcgattataaaacccttcaagctggacgatgtccg >purL attctctgtgtcgtgcgcgtcccagcttgaaaaaacgtaataatagtgaaaggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagacttatgatggaaattctgcgtggttcgcctgcactgtcggcattccgaatcaa >purA tagggccgatgctttacccgaaggcatggaagaagatgatctctgcgatgaccaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaatgggtaacaacgtcgtcgtactgggcacccaatggggtgacgaaggtaaa- Сравннение результатов с реальными сайтами узнавания PurR.
- чувствительность (отношение числа правильных предсказаний к числу реальных сайтов)........ 0,9
- специфичность отношение числа правильных предсказаний к общему числу предсказаний (правильных и неправильных).........0,9
- Во всех случаях правильных предсказаний (предсказанный сайт пересекается с реальным >, чем на 8 нуклеотидов) координаты предсказанного сайта были сдвинуты на 1 относительно реальных (влево для прямой цепи, вправо для обратной). В одном случае сайт был предсказан неправильно, достаточно далеко от реального.