Практикум 9. Факторы транскрипции. Поиск de novo сигналов в ДНК

Подготовка данных

В рамках данного практикума был проведён поиск последовательности Шайна — Дальгарно (SD) — консервативного элемента, обеспечивающего взаимодействие рибосомы с мРНК у прокариотических организмов. Поиск производился в геноме бактерии Streptomyces globosus. Для работы использовался скрипт, автором которого является Масленников Вячеслав Вадимович, переделанный под мои файлы (файл fasta и файл gff3). Результатом скрипта стали 3 выходных файла:

Поиск с помощью MEME

На основании созданной группы для обучения с помощью MEME был осуществлен поиск мотива похожего на SD следующей командой:

Искался один мотив длиной от 5 до 10 нуклеотидов, что соотвествует SD по литературным данным.

Результатом выполнения данной программы стала директория meme_out, в которой появились следующие файлы: logo1.eps, logo1.png, logo_rc1.eps, logo_rc1.png, meme.html, meme.txt, meme.xml. Самыми нужными для практикума являются html-файл и png-файлы:

Рисунок 1. Найденный с помощью MEME мотив AAGGAG, похожий на SD, (E-value = 1.5e-011).
Рисунок 2. Последовательность, комплементарная найденному мотиву, соотвествует последовательности anti-SD.

По литературным данным SD богата AG, при этом консенсусом считается AGGAGG, а мой мотив AAGGAG, что очень похоже.

Поиск с помощью FIMO

Для проверки универсальности выявленного мотива (обнаруженного в обучающей группе с помощью MEME) был проведён локальный поиск через FIMO в обеих контрольных группах:

Параметр -thresh 0.001 задаёт порог значимости: сохраняются совпадения с p-value < 0.001.

Результатами программ стали директории fimo_pos и fimo_neg. Здесь представлены ссылки на html-neg и на html-pos. По результатам выдачи оказалось, что среди группы положительного контроля 1310 значимых находок (что больше 1/5 подаваемых в группе последовательностей), а среди группы отрицательного контроля - 313 значимых находок (чуть больше 5% от общего числа, что очень мало). Исходя из полученных результатов, можно сделать вывод, что найденный мотив AAGGAG, скорее всего, является консенсусной SD для данной бактерии.