Подготовка входного файла msf. Рассчет веса строк.

У входного файла был удален конец строки, характерный для Windows (была использована команда noreturn). Затем был рассчет веса с помощью программы pfw.

Файл до обработки

Файл после обработки


Нетрудно заметить, что изменились лишь цифры характеристики Weight.

Создание профиля

Профиль, как и указано в методике, был создан с помощью pfmake. Матрица, как и в методике, blosum62.cmp

Файл профиля

Поиск по профилю

Был взят файл bacteria.fasta, что значит, что поиск был произведен по всем бактериальным последовательностям. Профиль не нормировался.

Поиск производился с помощью программы pfsearch. Все было сделано как в Методике, за исключением порога (порог C1.0 выдавал слишком много белков. Был выбран порог C3.0 - с ним были найдены 1404 белка)

Результаты поиска

Файл, выданный в результате поиска
True positive: 94
False positive: 1310
False negative: 0
Чувствительность: 1
Селективность: 0,07

ROC-кривая:


Для тех, кто хочет ознакомиться с Excel-файлом

Селективность, полученная в предыдущем задании, достигается при пороге C3.55

Назад