Практикум 7. Сигналы и мотивы - 2

Поиск сигнала посадки сигма-субъединицы РНК-полимеразы в промоторах генов генома Escherichia coli

Для работы был взят тот же штамм, что и в прошлом практикуме - Escherichia coli O157:H7 str. Sakai DNA (NC_002695.2).

Координаты оперонов были найдены с использованием сервиса Operon-maker. На вход подавался файл с геномом нашей бактерии в формате fasta.

В результате была получена таблица с координатами оперонов.

В качестве промотора берется участок длиной сто нуклеотидов непосредственно перед опероном.

Далее был подготовлен материал для обучения. Для этого было отобрано 70 случайно выбранных генов домашнего хозяйства. Поиск велся по ключевым словам в функциях оперона гена. Тестовые последовательности можно посмотреть здесь: learn.fasta

Негативный контроль был составлен из областей, которые мы считаем точно не промоторными. То есть были отобраны случайные последовательности длиной 100, полученные из оперонов после сотого нуклеотида. Последовательности можно посмотреть здесь: negative-control.txt.

В набор для тестов были помещены все последовательности, полученные из Operon-maker. Тестовый файл: test.fasta.

Поиск гомологов проводился с помощью сервиса MEME. На вход подавался полученный файл с оперонами, со следующими параметрами:

Site distribution Zero or One Occurrence Per Sequence (zoops)
Number of motifs 3
How wide can motifs be 8—50
Can motif sites be on both strands search given strand only
Background model 0-order model of sequences
How many sites must each motif have 10—600

Таблица 1: Параметры при запуске MEME

В результате было найдено три мотива, со следующей текстовой выдачей: meme-out.txt.

Их LOGO представлены ниже:

Их e-value были соответственно: 1.1e+001, 1.2e+003 и 9.4e-001. Для дальнейшей работы был выбран мотив с наименьшим e-value, то есть последний.

С помощью FIMO проводился поиск выбранного мотива в тестовой группе и в группе негативного контроля. В результате было найдено 183 мотива в тестовой группе и 75 в негативной группе. Наличие такого количества мотивов в негативном контроле настораживает, но это по-прежнему более чем в два раза меньше находок для тестовой группы.