Сигналы и мотивы - 2

Задание 1.

В качестве задачи был выбран поиск последовательности сайта посадки сигма-субъединицы в хромосоме бактерии Erwinia pyrifoliae strain EpK1/15, протеом которой был исследован в рамках работы в первом семестре.

С NCBI Genome был скачан геном бактерии и таблица генов в формате gff. Из файлов была удалена информация не относящаяся к хромосоме. Для поиска оперонов был использован сервис operon-mapper. Его выдача доступна по ссылке. Далее был написан скрипт принимающий на вход fasta-файл с хромосой и файл list_of_operons.txt, и выдающий 2 fasta-файла: один со всеми промоторами - 150-нуклеотидными участками перед первым страрт-кодоном оперона, другой с сотней случайных промоторов. Первый использовался в качестве входной последовательности для FIMO, а второй - для MEME (использовалась веб-версия). Параметры программы MEME настроены следующим образом: поиск 3 мотивов, встречающихся 0 или 1 раз в каждой последовательности, длина мотива от 25 до 60 нуклеотидов, поиск только по данной цепи. Выдача MEME доступна по ссылке

Табл. 1. Мотивы найденные MEME
Logo E-value Sites  Width

ДНК

2.2e-004  22 25

ДНК

38  5 45

ДНК

100  7 29

Был найден один мотив с приемлемым e-value. Возможно сайт богатый аденинами соответсвует -35 боксу, а последующий малостабильный участок - спейсеру, а -10 бокс попал в мотив лишь частично. Так или иначе этот мотив был использован в качестве входногов FIMO(Выдача). Было найдено 129 находок в 2080 промоторах, что свидетельствует о том, что либо этот мотив не имеет отношения к сайту посадки сигма-субъединицы, либо недостаточно полно и точно его описывает.