Отчет за практикум 7

Подготовка данных

Для выполнения заданий практикума я выбрала бактерию Clostridium botulinum A str. ATCC 3502. Я скачала ее геномную сборку и аннотацию генов из GeneBank и с помощью сервиса Operon-mapper получила список оперонов. Затем с использованием скрипта Георгия Муравьева были получены следующие файлы:

housekeeping.fasta - материал для обучения.
promotors.fasta - материал для тестирования.
negative.fasta - материал для негативного контроля.

Запуск MEME

Я запускала программу MEME на kodomo с помощью следующей команды:

meme housekeeping.fasta -dna -minw 5 -maxw 50 -nmotifs 3

Текстовую выдачу программы можно увидеть здесь -> meme.txt.

Было найдено 3 мотива:

1) WTCCTCCWY E-value = 1.7e-120
2) WAGGAGGDDW E-value = 2.6e-053
3) CYTYTTCCWCGTYYTS E-value = 2.8e-001

Порог по E-value прошли первые два. Они оба похожи на последовательность Шайна-Дальгарно, но у первого намного ниже E-value, так что для дальнейшей работы я выбрала его.

Рис. 1 Logo находки 1

Рис. 2 Logo находки 2

Рис. 3 Logo находки 3

Поиск сигнала в материале для тестирования с помощью FIMO

Я запустила FIMO для материала тестирования и для материала отрицательного контроля с помощью следующих команд:

fimo --norc -motif WTCCTCCWY -thresh 0.001 meme_out/meme.txt promotors.fasta
fimo --norc -motif WTCCTCCWY -thresh 0.001 meme_out/meme.txt negative.fasta

Полученные файлы: promotors_fimo.tsv, negative_fimo.tsv.

Было найдено 1344 находок среди промоторов (всего их было 3694), для негативного контроля нашлось намного меньше - 29.