Учебный сайт Екатерины Швецовой

Поиск регуляторных мотивов транскрипции в бактериальных последовательностях

Сайты связывания транскрипционных факторов у прокариот можно искать при помощи методов сравнительной геномики, например, используя программу MEME.

Исходно был дан набор промоторных областей генов E.coli (ссылка на файл) и список экспериментально установленных сайтов связывания белка PurR (ссылка на файл).

При запуске MEME использовался режим Discriminative mode. Файл, содержащий последовательности промоторных областей, был загружен в поле "Input the primary sequences", файл с экспериментально подтвержденными сайтами связывания белка был загружен в поле "Input the control sequences". Выполнялся поиск одного мотива в каждой последовательности (поле "How many motifs should MEME find?") и была выставлена длина мотива - 16 нуклеотидов (поле "How wide can motifs be?").

Запуск проводился два раза: с параметром "One per sequence" и с параметром "Zero or one per sequence" (этот параметр меняется в поле "How do you expect motif sites to be distributed in sequences?" и отвечает за то, сколько мотивов программа будет искать в каждой последовательности).

В результате было получено несколько файлов, содержащих информацию о предположительных сайтах связывания PurR. Анализировались файлы в формате txt: meme_1.txt для "One occurence per sequence" и meme_01.txt для "Zero or one occurence per sequence".

Экспериментальные данные и предсказания были отмечены на последовательностях и сохранены в файле seqs.doc. Для мотивов, найденных на комплементарной цепи, выполнялся поиск обратно-комплементарных им сайтов на исходной последовательности. В файле синим отмечены сайты, установленные экспериментально, курсивом - предсказанные с параметром "One occurence per sequence" (15 мотивов, но 2 из них с p-value больше 10-4), а жирным шрифтом - с параметром "Zero or one occurence per sequence" (12 мотивов).

Длина последовательностей - 200 нуклеотидов. Для пяти из пятнадцати данных промоторных последовательностей (folD, rpiA, carA, pdhR, fixA) нет экспериментально установленных сайтов связывания транскрипционного фактора PurR. Для девяти из десяти последовательностей, имеющих экспериментально доказанные сайты связывания, сайты, предсказанные с помощью MEME, совпали с экспериментально доказанными (сайт считается совпадающим с экспериментальным, если он пересекается с ним на 8 или более нуклеотидов). Для последовательности purA предсказание не совпало с экспериментальными данными (пересечения нет совсем). Для последовательностей folD и carA были предсказаны сайты связывания, причём для rpiA только на основе одного из двух предсказаний. Для rpiA, pdhR и fixA сайты связывания PurR найдены не были.

© Shvetsova Ekaterina, FBB MSU, 2013
Дата последнего изменения: 07.12.2016