MEME


Поиск предполагаемого места связывания

Для того, чтобы найти общий мотив в данных последовательностях ДНК E.coli, находящихся перед генами, регулируемыми белком PurR (пуриновым репрессором), был использован сервер MEME.

Последовательности в формате fasta были скопированы в текстовое поле. Поиск был ограничен одним мотивом длины ровно 16 нуклеотидов (максимальная и минимальная длина мотивов была установлена на 16). Для распределения числа встреч мотива в последовательностях было выбрано "Zero or one per sequence". После нажатия кнопки "Start search" перешел по гиперссылке на страницу, на которой после окончания расчётов появились гиперссылки на страницы с результатами, где выбрал "MEME output as HTML".

Результаты расчетов MEME

LOGO найденого мотива:

PSSM (Position-Specific Scoring Matrix) найденого мотива:

+ A C G T
1 R 119 -1010 71 -1010
2 A 185 -1010 -1010 -1010
3 G -3 -129 71 -3
4 G -1010 -1010 217 -1010
5 M 71 130 -1010 -1010
6 A 171 -129 -1010 -1010
7 A 171 -1010 -129 -1010
8 A 119 -29 -1010 -61
9 C -1010 217 -1010 -1010
10 G -1010 -1010 217 -1010
11 T -61 -1010 -29 119
12 T -1010 -1010 -1010 185
13 T -1010 -1010 -1010 185
14 G -61 -129 130 -61
15 C -1010 203 -129 -1010
16 S -161 30 152 -1010

+ столбец - это множество нуклеотидов, дающих положительный вклад в вес в данной позиции.

Из 18 последовательностей мотив был найден в 11:

Имя последовательности Цепь Координата первого нуклеотида
purM - 121
cvpA - 129
purE - 114
purR + 138
pyrC + 132
purL - 109
codB - 118
guaB + 130
purA + 77
glnB + 116
carA + 90

Ниже приведены участки последовательностей (начиная с 70 нуклеотида), подчеркнутые участки - предсказанные с помощью MEME, а выделенные жирным шрифтом - экспериментально установленные сайты связывания белка PurR из Escherichia coli:

>codB
ttttcccccacctttttgcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg

>purE
attttccgttttaaaaaacccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc

>pyrC
aaattgtcattccatttactgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta

>purR
accccttcctgacgctccgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa

>cvpA
cgatggcgttgaatattttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat

>purM
ttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag

>guaB
ttattcagtcgatagtaacccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc

>glnB
ggcgcaaccggacagaattttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc

>purL
cggcacgcgttgctaattcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt

>purA
tacatgttgaggaaaacgattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaa

>carA
ttttagcgcccatatctccagaatgccgccgtttgccagaaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatattctctggagggtgttt
		

Таким образом, MEME с большой точностью предсказал сайты в 9 из 10 последовательностях, в одной последовательности нашел сайт неправильно и в одной последовательности нашел сайт, хотя его там не обнаружено экспериментально. Если считать чувствительностью отношение числа правильных предсказаний к числу реальных сайтов, а специфичностью — отношение числа правильных предсказаний к общему числу предсказаний, то чувствительность MEME в данном случае равна 90,00%, а специфичность - 81,82% (если реальный сайт считать предсказанным верно в случае, когда он пересекается с предсказанием по 8 или более нуклеотидам). Можно сказать, что MEME удовлетворительно справился с задачей, правда она была достаточно легкой.


Назад

2009 ©