Программа MEMEПоследовательности ДНК E.coliПользуясь сервером MEME, нашел общий мотив в последовательностях ДНК (предполагаемый сигнал, узнаваемый белком PurR). Для этого провел поиск с заданными параметрами (количество встреч каждого мотива - не более 1го на последовательность, длина мотива - 16, число различных мотивов - 1). В результате мною было получено LOGO (матрица, показывающая возможность появления определенного буквы в поределенной позиции на протяжении всего мотива, чем больше вероятность, тем больше буква): Матрица PSSM (используется поисковыми программами, такими как MAST):
Таблица найденных мотивов:
Исходные последовательности (найденный мотив подчеркнут): >codB aaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg >purE tgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc >pyrC agggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta >purR ggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa >cvpA tttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat >purM aaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag >guaB gatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc >glnB ttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc >purL ttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt >purA aaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaa >folD tcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgatctacgtaacagatggaatcctctctctg >rpiA tattttatggatgagttaaccacgcggcttgccaacggggtctgaatcgctttttttgtatataatgcgtgtgaaatttcataccacaggcgaaacgatc >carA tttgccagaaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatattctctggagggtgttt >pdhR cctgtatggacataaggtgaatactttgttactttagcgtcacagacatgaaattggtaagaccaattgacttcggcaagtggcttaagacaggaactca >fixA tgaaagttggatttatctgcgtgtgacattttcaatattggtgattaaagttttatttcaaaattaaagggcgtgatatctgtaattaacaccaccgata Сверим полученные данные с экпериментально полученными результатами 1. Координаты предсказанных сайтов в большинстве случаев расходятся с реальными (в основном на 1-2 нуклеотида) 2. Чувствительность = 10/10, специфичность = 10/11 Назад |