Сигналы и мотивы - 2.

1. Поиск сигнала посадки рибосомы у прокариот – последовательность Шайн-Дальгарно

В качестве объекта исследования была выбрана бактерия Jeotgalibaca arthritidis, геном которой мне был предложен для обзора в 1 семестре. Данные грамположительные бактерии были выделены из суставной жидкости свиньи.
Последовательность Шайн-Дальгарно (ШД) находится на расстоянии 6-8 нуклеотидов от стартового кодона. Для начала следовало отобрать и отредактировать последовательности, в которых будет производиться поиск мотива. Для выполнения данной задачи был написан скрипт, аналогичный скрипту Гукова Бориса. На вход скрипту подается расширенный genbank файл, далее из него отбираются кодирующие хорошо аннотированные гены, из которых вырезаются последовательности длиной 23 (20 нк до стартового кодона + АТГ). Отбор генов велся только по одной цепи.
В результате программа выдает 2 файла: файл с 40 последовательностями для поиска мотивов программой MEME (в этот файл я также добавила последовательность 16S рРНК с 3'конца, поскольку комплементарная к ШД последовательность находится в том участке); файл c 722 последовательностями для тестирования с помощью FIMO.

Для поиска мотивов я использовала веб сервер MEME. Параметр числа мотивов был равен 3, длина мотива от 6 до 9 позиций, поиск только по одной цепи. Выдача MEME в html формате.
Найденный мотив представлен в виде LOGO на рисунке 1. Он имеет вид AAAGGAGG и действительно содержит в себе консервативную часть Шайн-Дальгарно (GGAGG), на основании чего можно полагать, что находка соответствует искомому сигналу. Файл в формате meme с мотивом и позиционно-весовой марицой доступен по ссылке.

fig1
Рис. 1. Лучший мотив в виде LOGO

2. Поиск сигнала Шайн-Дальгарно в тестовой выборке. FIMO

Для выполнения данного задания я запустила сервер FIMO, перенаправив выдачу MEME на вход серверу. Поиск проводила по отобранным 722 фрагментам. Порог p-value 0.0001. Программа нашла 79 включающих мотив находок, удовлетворяющих порогу p-value. Выдача FIMO доступна по ссылке. В результате поиска с более высоким поргом p-value (0.001) нашлось 333 находки (ссылка на выдачу).
Как мы видим, поиск мотива с помощью MEME дал положительный результат, поскольку на основе выдачи данной программы можно находить достоверные сигналы в последовательностях. Можно сделать вывод, что у бактерии J. arthritidis сигналы посадки рибосомы Шайн-Дальгарно вполне представлены (11% находок с низким p-value (0.0001) содержат в себе мотив ШД).