Сигналы и мотивы 2. Поиск сигнала посадки σ-субъединицы РНК-полимеразы

Выбор бактерии и подготовка данных.

Для работы был взят Bacillus cereus NC7401. С помощью Operon-mapper нашел координаты оперонов бактерий. С помощью скрипта осуществил поиск 100 оперонов, содержащих исследуемые гены и записывал 100 промоторных областей этих оперонов в отедльный файл. Кроме того получаем файл тестовой выборки.

housekeeping.fasta, promoters.fasta negativecont.fasta

Запуск MEME.

Поиск мотивов осуществлялся на кодомо с помощью команды ниже:

meme house_keeping_promoters.txt -dna -mod zoops -nmotifs 3 -minw 6 -maxw 50

В результате были получены 3 мотива, представленные ниже:

К
Рисунок 1. Мотив №1
К
Рисунок 2. Мотив №2
К
Рисунок 3. Мотив №3

Для дальнейшей работы был взят 1 мотив как самый подходящий.

Запуск Fimo. Поиск сигналов в последовательностях тестовой выборки с помощью Fimo.

  1. Поиск проводил по мотиву aaaGGAGG в тестовой выборке и выборке негативного контроля. Для этого на вход локальной версии fimo были переданы сама последовательность мотива, файл тестовой выборки, файл негативного контроля и выдача meme:

    fimo --norc -motif AAAGGAGG -thresh 0.001 meme_out/meme.txt all_promoters.fasta
    fimo --norc -motif AAAGGAGG -thresh 0.001 meme_out/meme.txt negative_cont.fasta

    Результаты поиска:

    Файлы: fimo_p.tsv и fimo_n.tsv

    В 1065 последовательностях тестовой выборки обнаружился сигнал сигнал. И только 314 сигналов было найдено в выборке негативного контроля.

  2. Список литературы

    1. Jin-Der Wena, Syue-Ting Kuo, and Hsin-Hung David Chou. The diversity of Shine-Dalgarno sequences sheds light on the evolution of translation initiation. RNA BIOLOGY, 2021, VOL. 18, NO. 11, 1489–1500, https://doi.org/10.1080/15476286.2020.1861406