Сигналы и мотивы

Подготовка данных

Для поиска оперонов в геноме я выбрала бактерию Pseudomonas aeruginosa str. PSE305 (GCA_000750905.1). Для поиска оперонов использовался Operon-mapper , на вход которому был подан файл fasta c геномом выбранной бактерии. На выходе был получен файл со списком всех найденных оперонов.
Для дальнейшей подготовки данных был использован скрипт Георгия Муравьёва . Промотором было решено считать 100 нуклеотидов перед опероном.

Получили на выход:

MEME

Команда:
meme housekeeping.fasta -dna -mod zoops -nmotifs 3 -minw 6 -maxw 50 -maxsites 50

Результат команды: файл

Рис 1. LOGO первого мотива

Рис 2. LOGO второго мотива

Рис 3. LOGO третьего мотива

Мотивы:

  • AAAWWAWMMDDWTWTWHNWHWDWHTTTWW E-value = 4.1e-030
  • KTKTKVHTVTTTTTY E-value = 3.6e-002
  • MTTTTGSKGSKGNAGSSSGCSMCGNWWACGWWARMRSGYTWWARA
    E-value = 4.2e-001

Поиск сигнала с помощью FIMO

С помощью FIMO проводился поиск выбранного мотива в тестовой группе и в группе негативного контроля.
В результате при пороге 0,001 было найдено 164 мотива в тестовой группе (promotors_fimo.tsv) и 3 в негативной группе ( negative_fimo.tsv).