Создайте файл, содержащий тот участок выравнивания рибосомальных белков
из выбранного вами таксона, по которому вы строили паттерн
(для этого надо удалить из выравнивания часть колонок и
контрольные последовательности, после чего сохранить полученное
частичное выравнивание в файл с новым именем).
Запустите на kodomo программу profit и в ответ на вопрос о файле
с профилем укажите имя файла, созданного программой prophecy,
а на вопрос о входных последовательностях — имя файла с
бактериальными белками.
Далее будем работать со всеми находками, если их менее 10000. Если же получилось, что их больше, то в дальнейшей работе следует ограничиться лишь находками со счётом более 40 (если вдруг и их больше 10000, то поднимите порог ещё выше).
Грубо говоря, чем выше расположена эта кривая, тем лучше наш профиль. См. также http://en.wikipedia.org/wiki/ROC_curve, там описан немного другой вариант ROC-кривой, который в нашем случае менее удобен.
Сам график имеет смысл строить в Excel, данные можно готовить как в Excel, так и написав подходящий скрипт.