Подготовка входного файла msf. Рассчет веса строк.
У входного файла был удален конец строки, характерный для Windows (была использована команда noreturn). Затем был рассчет веса с помощью программы pfw.
Нетрудно заметить, что изменились лишь цифры характеристики Weight.
Создание профиля
Профиль, как и указано в методике, был создан с помощью pfmake. Матрица, как и в методике, blosum62.cmp
Файл профиляПоиск по профилю
Был взят файл bacteria.fasta, что значит, что поиск был произведен по всем бактериальным последовательностям. Профиль не нормировался.
Поиск производился с помощью программы pfsearch. Все было сделано как в Методике, за исключением порога (порог C1.0 выдавал слишком много белков. Был выбран порог C3.0 - с ним были найдены 1404 белка)
Результаты поиска
Файл, выданный в результате поискаROC-кривая:
Для тех, кто хочет ознакомиться с Excel-файлом
Селективность, полученная в предыдущем задании, достигается при пороге C3.55