Поиск сигналов
Главная

Поиск регуляторных мотивов транскрипции в бактериальных последовательностях

В данном задании было предложено провести поиск регуляторов транскрипции в последовательностях из выданного файла c помощью программы MEME. Отчет по заданию можно скачать по ссылке.

Сервис PePPER prokaryote promoters

Работа выполнена совместно с Васюткиной Ольгой. Ссылка на страницу.

С помощью сервиса PePPER prokaryote promoters можно предсказывать промоторные регионы у прокариотических организмов. Поиск этих регионов основывается на перепредставленности в геномах последовательностей из 6 нуклеотидов [1]. Допустимую длину спейсера программа считает равной 16-18 нуклеотидов. Соответственно длина последовательности на выходе составляет 28-30 нуклеотидов (6 нуклеотидов, соответствующих -35 области, + спейсер + 6 нуклеотидов, соответствующих -10 области).

Программа имеет два окна для входных данных (рис. 1). В первое окно надо ввести ДНК последовательность или последовательности, в которых требуется предсказать промоторы, в формате fasta. Важно, что перепредставленность сайта считается в каждой последовательности отдельно, если на вход было подано несколько последовательностей. Поэтому, если требуется, например, найти промоторы в нескольких последовательностях из одного генома, то их нужно объединить в одну. Второе окно, по-видимому, не работает, так как при вводе в него данных в указанном формате ничего не меняется. Функция данного окна, видимо, состоит в том, что если известны гены и нужно предсказать промоторы только между ними, то в него надо ввести таблицу, в которой табуляторами разделены 4 колонки: название гена (видимо, условное обозначение гена, для того чтобы привязать к нему промотор), старт, конец, ориентация ("+" или "-").

Рис. 1. Стартовая страница PePPER prokaryote promoters

В результате работы программы выводится таблица, фрагмент которой представлен на рис. 2. Таблица состоит из 10-ти колонок: описание входной последовательности из fasta-файла, сама предсказанная последовательность, координаты (начало и конец в прямом направлении), предсказанный старт транскрипции, ориентация, длина и вес предсказанной последовательности. Также такую таблицу предлагается скачать в виде текстового файла.

Рис. 2. Результат работы программы PePPER prokaryote promoters. Представлен фрагмент таблицы, содержащий первые 10 предсказанных последовательностей

При запуске данной программы на целом геноме даже предсказанные промоторы с большим весом находились на больших расстояниях от ближайших генов (> 200 нуклеотидов, что является слишком большой длиной 5' нетранслируемой области для прокариот). Предсказание промоторов является очень сложной задачей, так как связывающая -10 последовательность может быть расширена до 8 нуклеотидов: добавляются два, со стороны старта трансляции, а -35 область тогда вообще не связывается. К тому же есть разные факторы, делающие связывание с -35 областью неспецифичным.

Также программа была протестирована на объединённых последовательностях из одного генома длинной 100 нуклеотидов каждая, находящихся перед старт-кодонами генов с Uniprot protein evidence 1. В результате для входных 39 последовательностей было предсказано 4 промотора. Такой результат может быть связан с оперонами, в которых не каждый ген имеет свой промотор. Однако объяснением такого результата может являться, возможно, ошибочный расчет веса, что влечет за собой отбрасывание правильных вариантов. Еще стоит принять во внимание установленные пороги для длин спейсеров, так как в некоторых организмах они могут быть другими. Правильнее было бы, если пользователь их мог задавать сам. Тогда при запуске этой программы несколько раз с разными порогами, возможно, можно было бы получить более точные результаты.

Профиль PWM для последовательности Шайна-Дальгарно в геноме бактерии

Был взят геном бактерии Amycolatopsis mediterranei, штамм U32 (идентификатор NCBI - NC_014318). Были вырезаны области -35:0 для генов с Uniprot protein evidence 1, 2 или 3. Далее по полученным 666 последовательностям был построен профиль PWM c помощью программы MEME. Затем при помощи программы MAST был запущен поиск по всем последовательностям из построенного профиля. Результат можно скачать по ссылке. Так как проанализирована Грам-отрицательная бактерия, P-value даже лучших сайтов оказался большим 1E-04.

Литература

1. de Jong, A., Pietersma, H., Cordes, M., Kuipers, O.P., Kok, J. (2012) PePPER: a webserver for prediction of prokaryote promoter elements and regulons, BMC Genomics 13:299, 3-10

Обо мне
Ссылки


Valid HTML 4.01 Transitional