Факторы транскрипции

Подготовка данных

Моя бактерия - Vescimonas coprocola. В ходе практикума я пыталась найти последовательность Шайна-Дальгарно (SD) в ее геноме. С помощью скрипта моего однокурсника Масленникова Вячеслава было создано 3 набора последовательностей:

Поиск с помощью MEME

Я нашла мотив длиной 6-10 нуклеотидов, что соответствует длине SD c помощью команды:

meme TRAIN.fasta -dna -nmotifs 1 -minw 6 -maxw 10

Рис. 1. Logo, E-value = 7.9e-105

Поиск с помощью FIMO

Используя FIMO, я провела поиск найденного для группы обучения с помощью MEME мотива для двух групп контроля. Я ввела команды:

fimo --oc fimo_pos -thresh 0.001 meme_out/meme.txt POSITIVE.fasta

Файл с выдачей

fimo --oc fimo_neg -thresh 0.001 meme_out/meme.txt NEGATIVE.fasta

Файл с выдачей

Я могу сделать вывод, что последовательность Шайна-Дальгарно (или ее аналог) бактерии Vescimonas Coprocola - AAGGAGGGGA.