Для выполнения задания был взят геном бактерии Rubrobacter marinus. По этому геному был проведён поиск мотива сигнала посадки сигма-субъединицы РНК-полимеразы в промоторах генов.
С помощью сервиса Open-mapper было выполнено предсказание координат оперонов. В результате получили таблица с указанием генов для каждого оперона, его координат. Далее было взято 100 оперонов, из которых были отобраны те, что находились на + цепи (для простоты последующего получения последовательностей) и чья функция была указана. Получилось 52 оперона для анализа. Используя координаты начала оперона, из генома бактерии были извлечены последовательности на 100 нуклеотидов выше начала наших оперонов. Такие последовательности будем считать входящими в промоторные области. В качестве отрицательного контроля использовал столько же последовательностей, но лежащих ниже начала оперона. Там изучаемого сигнала не ожидаем. Таким образом, мы подготовили необходимые данные для поиска сигнала!
Приступим к поиску сигнала. Передав сервису MEME извлечённые промоторные последовательности, установим длину мотива, равной 6, согласно иллюстрации из презентации лекции, а также задав поиск только по одной цепи, получили следующие результаты.
Как и было указано на входе, программа нашла три сигнала, но сразу бросается в глаза очень сильный сигнал, да к тому же типичный TATA-box. Однако нашёлся он всего в нескольких из поданных последовательностях. По всей видимости, как и было сказано в статье (Soutourina et al.), место посадки сигма-субъединицы может варьировать по расстоянию от -10 элемента. Думаю, это можно заметить и из Motif Locations: этот мотив (синий на рисунке) встретился в разных участках последовательностей.
Этот мотив был передан FIMO. Было интересно узнать, насколько часто он встречается во всём геноме. Оказалось, точно такая же последовательность встречается 99 раз. При поиске в отрицательном контроле она нашлась трижды, видимо, по случайным причинам какие-то последовательности захватили промоторную область.
Итак, думаю, достаточно оснований полагать, что нашёлся именно сигнал посадки сигма-субъединицы РНК-полимеразы. Сила сигнала была высокой, а сам мотив встретился много раз. Также полученные результаты согласуются с тем, что расстояния между этими upstream элементами может варьировать, причём ощутимо.