Для выполнения практикума была выбрана бактерия Bacillus Subtilis штамма 168. Для нее были скачаны последовательность хромосомы и аннотация в формате GFF. Эти файлы были переданы на вход сервису Operon-mapper для получения списка оперонов.
Затем по списку оперонов и последовательности хромосомы были получены промоторные области (участки 100 п.н. перед оперонами) оперонов бактерии Bacillus Subtilis. Из них вручную были выбраны 20 промоторных областей генов домашнего хозяйства:
Промоторные области генов домашнего хозяйстваТакже были получены последовательности негативного контроля (путем смещения выбранных последовательнотей на 110 п.н.).
Cервис MEME-suit был запущен для отобранных последовательностей генов домашнего хозяйства со следующими параметрами:
Select the site distribution - 0 или 1
Select the number of motifs - 3
How wide can motifs be? - от 5 до 60 (был удивлен, но программа работала довольно быстро)
Can motif sites be on both strands? - Нет
How many sites must each motif have? - Min=2
В результате работы программы было получено 2 мотива с p-value меньше 0.05 (Рисунок 1 и 2), их расположение в промоторных областях можно увидеть на Рисунке 3:
Несмотря на большее значение p-value у мотива 1, я решил выбрать для дальнейшей работы мотив 2, т.к. он встречается во всех последовательностях генов домашнего хозяйства, при этом в 14-ти из них он расположен в -35 -15 регионе.
Со страницы MEME HTML output выбранный мотив был передан в сервис FIMO. Программе были переданы на вход выборки всех промоторных участков перед оперонами бактерии и негативного контроля (сдвинутые на 110 п.н. участки тех же оперонов). В каждой выборке было 2290 последовательностей. Файлы доступны по ссылкам ниже:
Промоторные области оперонов Bacillus Subtilis
Значение e-value было выборано на уровне 1.0E-4 по принципу минимизации неспецифичных находок: при значении e-value 1.0E-3 в выборке негативного контроля найдено 364 совпадения, тогда как при e-value 1.0E-4, уже всего 30. Результаты поиска мотива в последовательностях выборок приведены в Таблице 1:
Таблица 1. Результаты поиска мотива в последовательностях промоторных областей и случайных последовательнотях хромосомы Bacillus Subtilis
Промоторные области | Негативный контроль | |
Сигнал (+) | 338 | 30 |
Сигнал (-) | 1952 | 2260 |
У бактерии Bacillus Subtilis транскрипцию генов домашнего хозяйства обеспечивает σ-фактор SigA. Результаты полученные в процессе выполнения практикума (338 оперонов с мотивом для связывания σ-фактора генов домашнего хозяйства) хорошо согласуются с имеющимися литературными данными: SigA регулирует транскрипцию 358 оперонов по данным Coelho RV et al. [1].
Сслыка на источники информации:
1 - Coelho RV, de Avila E Silva S, Echeverrigaray S, Delamare APL. Bacillus subtilis promoter sequences data set for promoter prediction in Gram-positive bacteria. Data Brief. 2018 May 13;19:264-270. doi: 10.1016/j.dib.2018.05.025. PMID: 29892645; PMCID: PMC5993011.