Поиск регуляторных мотивов транскрипции в бактериальных последовательностях

Заданием было найти регуляторный мотив в промоторной области белков E. coli. Файл с данными последовательностями можно посмотреть здесь. В качестве исходных данных были даны экспериментально установленные сайты связывания белка PurR .

Результат работы программы MEME представлен по ссылке. Экспериментально установленные сайты связывания белка PurR выделены синим шрифтом; курсивом выделены сайты, установленные программой MEME при запуске с параметром «One per sequence»; жирным – с параметром «Zero or one per sequence». Максимальная и минимальная длины мотивов задавались равными 16. В отчете знаком "-" помечены последовательности, для которых мотив был найден на комплментарной цепи.

Результаты для двух разных опций программы не совпадают. Метод «One per sequence» нашел больше сайтов. Часть из них не включена в отчет, так как обладает слишком большим e-value.

Для всех промоторных областей наденные MEME сайты заначительно перекрываются с экспериментальными данными (смещение на 1-3 нуклеотида из 16). Для 4 исходных последовательностей был найден мотив, но начальных данных нет.

Описание сервиса PePPER

Сервис располагается на сайте molgenrug.nl в разделе PePPER. Сервис выполняет 3 резличных типа задач: ищет промоторы в геноме прокариот, ищет мотивы в последовательностях ДНК или ищет сайты связывания транскрипционных факторов в заданном геноме.

В режиме поиска промоторов геноме прокариот, сервис требут на вход последовательность ДНК. На выходе сервис выдает таблицу найденных промоторов. В литературных источниках утверждается, что алгоритм поиска промторов универсален и не отталкивается от уже известных сайтов узнавания сигма-факторов.

В режиме поиска мотивов в ДНК севис может выполнить одну из нескольких операций: создать PFM (Position Frequency Matrix), искать мотивы по заданной PFM и данному геному, искать слова, заданные с помощью регулярных выражений, провести BLAST для заданного мотива и генома.

В режиме поиска сайтов связывания факторов транскрипции сервис ищет выбранный из списка сайт в выбранном геноме или последовательности ДНК.

© Маслова Валентина, 2014
Последнее изменение: 24.09.2014