1. Нахождение общего мотива в предложенных последовательностях.
На сервере MEME был выполнен
поиск общего мотива среди последовательностей из файла, содержащего
последовательности ДНК E.coli, находящимися перед генами, регулируемыми белком PurR (пуриновым репрессором).
Параметры поиска MEME:
распределение количества встреч каждого мотива:"Zero or one per sequence"
максимальная и минимальная длина мотива: по 16 (поиск мотивов со строго заданной длиной)
число различных мотивов: 1
В результате чего были получены, следующие результаты:
LOGO
Позиционно-спецефическая весовая матрица (PSSM)
Номера позиций мотива
A
C
G
T
Буква, отвечающей множеству нуклеотидов, дающих положительный вклад в вес
1
121
-982
65
-982
R
2
180
-982
-982
-982
A
3
21
-94
65
-37
R
4
-982
-982
223
-982
G
5
63
138
-982
-982
M
6
180
-982
-982
-982
A
7
180
-982
-982
-982
A
8
121
-94
-982
-37
A
9
-982
223
-982
-982
C
10
-982
-982
223
-982
G
11
-137
-982
6
121
K
12
-982
-982
-982
180
T
13
-982
-982
-982
180
T
14
-37
-94
106
-37
G
15
-982
223
-982
-982
C
16
-137
-94
187
-982
G
Таблица найденных мотивов
Имя последовательности
Цепь
Координата первого нуклеотида
purM
-
21
cvpA
-
29
purE
-
14
pyrC
+
32
codB
-
18
purR
+
38
purL
-
9
guaB
+
30
glnB
+
16
Исходные последовательности с подчеркнутыми мотивами
2. Сравнение результатов с реальными сайтами узнавания PurR.
С помощью МЕМЕ были найдены мотивы в 9 из 17 последовательностей.
Предсказанные сайты всех этих последовательностей совпадают с
реальными сайтами.
Число реальных сайтов: 10
Число правильных предсказаний: 9
Общее число предсказаний: 9
Чувствительность равняется 0,9
Специфичность равняяется 1
Во всех случаях правильных предсказаний координаты сайтов, предсказанных MEME
были сдвинуты на 1 нуклеотид относительно реальных (влево для прямой цепи, вправо для обратной).