Учебный сайт Софроновой Алины
Поиск сигналов
Поиск регуляторных мотивов транскрипции в бактериальных последовательностях

        Цель данного задания было найти регуляторный мотив (набор сайтов) в полученных последовательностях с помощью программы MEME.

        Для данного практикума был дан файл MEME14.txt, в котором лежал набор промоторных областей генов E.coli. Для белка PurR экспериментально установлены сайты связывания, которые содержаться в файле control.txt. Последовательности в файле MEME14.txt длиной 200 нуклеотидов, причем 4 из них (folD, rpiA, carA, pdhR) не содержат экспериментально подтвержденный сайт связывания. Запустили программу MEME с параметрами: Minimum length = 16, Maximum length = 16, Maximum number of motifs to find = 1, задавая различное число ожидаемых сайтов связывания. В первом случае ожидали 1 сайт связывания, во втором 0 или 1. И в том и другом случае p-value находок было меньше 10&sup-4. Если в первом случае программа была обязана найти сайт связывания в каждой пословательности, то во втором случае сайты связывания уже нашлись не для всех 14 последовательностях, а только для 11. Полученные данные были обработаны - Meme.docx. Синим выделены экспериментально установленные сайты, курсивом сайты, найденные с параметром «One per sequence», жирным шрифтом - с параметром «Zero or one per sequence». Все сайты (и экспериментальные, и предсказанные) на сером фоне. На Рис.1 приводена только основная выжимка из полученного файла:

Рис.1. Основные результаты поиска сайтов связывания программой MEME. Синим выделены экспериментально установленные сайты, курсивом сайты, найденные с параметром «One per sequence», жирным шрифтом - с параметром «Zero or one per sequence». Все сайты (и экспериментальные, и предсказанные) на сером фоне.

       Проанализируем полученные результаты. Ни для одной последоваельности сайт связывания был определен в точности. Для 9 из 10 последовательностей предсказанный сайт связывания отличается всего лишь одной буквой. Для оставшейся предсказанный сайт находился далеко от эксперименталльного и совсем не походил на него по своей структуре. Что касается оставшихся 4 последовательностей, то MEME с параметром «One per sequence» естественно нашла сайт связывания в каждой последовательности, а с параметром «Zero or one per sequence» был найден лишь один ошибочный сайт в последовательности carA. В 8 из 10 случаев эти два параметра ни на что не повлияли и дали одинаковые результаты, лишь для последовательностей glnB и purL результаты слегка разошлись. Если считать, что сайт совпадает с экспериментальным, если он пересекается с ним на 8 или более нуклеотидов, то в целом программа сработала хорошо - все сайты были найдены, правда был также найден один лишний сайт.



Вернуться к 4 семестру

© Алина Софронова, 2015
Дата последнего изменения: 12.03.2015