Для работы был взят тот же штамм, что и в прошлом практикуме - Escherichia coli O157:H7 str. Sakai DNA (NC_002695.2).
Координаты оперонов были найдены с использованием сервиса Operon-maker. На вход подавался файл с геномом нашей бактерии в формате fasta.
В результате была получена таблица с координатами оперонов.
В качестве промотора берется участок длиной сто нуклеотидов непосредственно перед опероном.
Далее был подготовлен материал для обучения. Для этого было отобрано 70 случайно выбранных генов домашнего хозяйства. Поиск велся по ключевым словам в функциях оперона гена. Тестовые последовательности можно посмотреть здесь: learn.fasta
Негативный контроль был составлен из областей, которые мы считаем точно не промоторными. То есть были отобраны случайные последовательности длиной 100, полученные из оперонов после сотого нуклеотида. Последовательности можно посмотреть здесь: negative-control.txt.
В набор для тестов были помещены все последовательности, полученные из Operon-maker. Тестовый файл: test.fasta.
Поиск гомологов проводился с помощью сервиса MEME. На вход подавался полученный файл с оперонами, со следующими параметрами:
Site distribution | Zero or One Occurrence Per Sequence (zoops) |
---|---|
Number of motifs | 3 |
How wide can motifs be | 8—50 |
Can motif sites be on both strands | search given strand only |
Background model | 0-order model of sequences |
How many sites must each motif have | 10—600 |
Таблица 1: Параметры при запуске MEME
В результате было найдено три мотива, со следующей текстовой выдачей: meme-out.txt.
Их LOGO представлены ниже:
Их e-value были соответственно: 1.1e+001, 1.2e+003 и 9.4e-001. Для дальнейшей работы был выбран мотив с наименьшим e-value, то есть последний.
С помощью FIMO проводился поиск выбранного мотива в тестовой группе и в группе негативного контроля. В результате было найдено 183 мотива в тестовой группе и 75 в негативной группе. Наличие такого количества мотивов в негативном контроле настораживает, но это по-прежнему более чем в два раза меньше находок для тестовой группы.