Практикум 7

Задание 1-2. Подготовка данных

Для выполнения практикума была выбрана бактерия Bacillus Subtilis штамма 168. Для нее были скачаны последовательность хромосомы и аннотация в формате GFF. Эти файлы были переданы на вход сервису Operon-mapper для получения списка оперонов.

Затем по списку оперонов и последовательности хромосомы были получены промоторные области (участки 100 п.н. перед оперонами) оперонов бактерии Bacillus Subtilis. Из них вручную были выбраны 20 промоторных областей генов домашнего хозяйства:

Промоторные области генов домашнего хозяйства

Также были получены последовательности негативного контроля (путем смещения выбранных последовательнотей на 110 п.н.).

Задание 3. Запуск MEME

Cервис MEME-suit был запущен для отобранных последовательностей генов домашнего хозяйства со следующими параметрами:

В результате работы программы было получено 2 мотива с p-value меньше 0.05 (Рисунок 1 и 2), их расположение в промоторных областях можно увидеть на Рисунке 3:

Мотив1
Рис. 1 Мотив 1
Мотив2
Рис. 2 Мотив 2
Мотив2
Рис. 3 Расположение мотивов в промоторных областях генов домашнего хозяйства

Несмотря на большее значение p-value у мотива 1, я решил выбрать для дальнейшей работы мотив 2, т.к. он встречается во всех последовательностях генов домашнего хозяйства, при этом в 14-ти из них он расположен в -35 -15 регионе.

Задание 4. Поиск сигнала в материале для тестирования с помощью FIMO

Со страницы MEME HTML output выбранный мотив был передан в сервис FIMO. Программе были переданы на вход выборки всех промоторных участков перед оперонами бактерии и негативного контроля (сдвинутые на 110 п.н. участки тех же оперонов). В каждой выборке было 2290 последовательностей. Файлы доступны по ссылкам ниже:

Промоторные области оперонов Bacillus Subtilis

Негативный контроль

Значение e-value было выборано на уровне 1.0E-4 по принципу минимизации неспецифичных находок: при значении e-value 1.0E-3 в выборке негативного контроля найдено 364 совпадения, тогда как при e-value 1.0E-4, уже всего 30. Результаты поиска мотива в последовательностях выборок приведены в Таблице 1:

Таблица 1. Результаты поиска мотива в последовательностях промоторных областей и случайных последовательнотях хромосомы Bacillus Subtilis

Промоторные области Негативный контроль
Сигнал (+) 338 30
Сигнал (-) 1952 2260

У бактерии Bacillus Subtilis транскрипцию генов домашнего хозяйства обеспечивает σ-фактор SigA. Результаты полученные в процессе выполнения практикума (338 оперонов с мотивом для связывания σ-фактора генов домашнего хозяйства) хорошо согласуются с имеющимися литературными данными: SigA регулирует транскрипцию 358 оперонов по данным Coelho RV et al. [1].

Сслыка на источники информации:

1 - Coelho RV, de Avila E Silva S, Echeverrigaray S, Delamare APL. Bacillus subtilis promoter sequences data set for promoter prediction in Gram-positive bacteria. Data Brief. 2018 May 13;19:264-270. doi: 10.1016/j.dib.2018.05.025. PMID: 29892645; PMCID: PMC5993011.