Занятие 12.

Отчёт должен появитья на вашем сайте к концу следующего занятия.

В таблице найдите против своей фамилии номер варианта. В директории P:\y08\Term_3\Block_4\PurR лежат файлы, содержащие последовательности ДНК E.coli, находящейся перед генами, регулируемыми белком PurR (пуриновым репрессором). Имя файла соответствует номеру варианта. Разные варианты различаются длиной последовательностей и количеством "лишних" последовательностей (не содержащих искомого сигнала).

  1. Пользуясь сервером MEME, найдите общий мотив в предложенных последовательностях (предполагаемый сигнал, узнаваемый белком PurR).

    Установите следующие параметры для MEME:

    В разделе "Optional" ничего не пишите.

    После нажатия кнопки "Start search" можно сразу пройти по гиперссылке на страницу, на которой после окончания счёта появятся гиперссылки на страницы с результатами.

    Вам нужна гиперссылка "MEME output as HTML". На открывшейся странице вам нужны: LOGO (сохраните его в PNG-формате), табличка с координатами сайтов и их P-value (сразу под LOGO), матрица PSSM.

    Отчёт в html-формате должен включать:


     
  2. Сравните результаты с реальными сайтами узнавания PurR.

    Добавьте к отчёту пункт, в котором опишите, насколько хорошо MEME сработал в вашем случае: каковы чувствительность и специфичность, всегда ли координаты предсказанного сайта в точности указывают на реальный. При подсчёте чувствительности и специфичности реальный сайт считайте предсказанным верно, если он пересекается с предсказанием по 8 или более нуклеотидам.

    Напоминание: чувствительностью называется отношение числа правильных предсказаний к числу реальных сайтов, специфичностью — отношение числа правильных предсказаний к общему числу предсказаний (правильных и неправильных).