Для анализа я выбрал цианобактерию, с которой работал в первом семестре - Oscillatoria acuminata PCC 6304. Получил координаты ее оперонов. На ее основе получена модель обучения, модель тестирования и модель контроля.
Для дальнейшей работы я выберу первый (самый левый и короткий мотив), так как он встречается почти во всех последовательностях. E-value для первого мотива состовляет 5.5e-006. На втором и третьем местах значение в 10 тысяч раз хуже.
Далее я запустил FIMO.
Результат поиска в тестовой выборке в таблице. Всего получилось найти 509 находок, но в качестве фильтра я выбрал классические 0.05 (для q-value). В таком случае получается 442 находки среди 431 последовательнстей. При этом в 11 из них были найдены два участка, сходные с иследуемым мотивом. При этом поиск осуществлялся по 6061 последовательностям (7,11%)
Результат негативного контроля доступен в таблице. Всего две находки с огромными (0,65) q-value