Для выполнения заданий практикума я выбрала бактерию Clostridium botulinum A str. ATCC 3502. Я скачала ее геномную сборку и аннотацию генов из GeneBank и с помощью сервиса Operon-mapper получила список оперонов. Затем с использованием скрипта Георгия Муравьева были получены следующие файлы:
housekeeping.fasta - материал для обучения.
promotors.fasta - материал для тестирования.
negative.fasta - материал для негативного контроля.
Я запускала программу MEME на kodomo с помощью следующей команды:
meme housekeeping.fasta -dna -minw 5 -maxw 50 -nmotifs 3
Текстовую выдачу программы можно увидеть здесь -> meme.txt.
Было найдено 3 мотива:
1) WTCCTCCWY E-value = 1.7e-120
2) WAGGAGGDDW E-value = 2.6e-053
3) CYTYTTCCWCGTYYTS E-value = 2.8e-001
Порог по E-value прошли первые два. Они оба похожи на последовательность Шайна-Дальгарно, но у первого намного ниже E-value, так что для дальнейшей работы я выбрала его.
Рис. 1 Logo находки 1
Рис. 2 Logo находки 2
Рис. 3 Logo находки 3
Я запустила FIMO для материала тестирования и для материала отрицательного контроля с помощью следующих команд:
fimo --norc -motif WTCCTCCWY -thresh 0.001 meme_out/meme.txt promotors.fasta
fimo --norc -motif WTCCTCCWY -thresh 0.001 meme_out/meme.txt negative.fasta
Полученные файлы: promotors_fimo.tsv, negative_fimo.tsv.
Было найдено 1344 находок среди промоторов (всего их было 3694), для негативного контроля нашлось намного меньше - 29.