Пакет Pftools
При выполнении этого задания я испотльзовала тоже выравнивание, что было взято в прошлом задании.
- Для того, чтобы приготовить входной файл msf,
использовалась команда noreturn:
- Рассчет веса строк выравнивания программаой pfw.
pfw aligned.noreturn
pfw.msf
Значения весов изменились (в исходном файле они были равны 1.00)
- Создание профиля програмой pfmake.
pfmake pwf.msf blosum62.cmp
Выходной файл
- Подготовка файла с последовательностями в fasta-формате,
в которых будет проводиться поиск.
seqret sw-org:bacteria bac.fasta
- Поиск по профилю.
pfsearch -C2.0 -f pfmake bac.fasta > my.pfsearch
- Анализ результатов.
Найдена последовательность
Вес > 50 - 99
Вес > 40 - 661
Вес > 30 - 767
Вес > 20 - 778
Вес > 3 - 817
Вес > 2 - 1944 (всего)
Excel
Число верных находок, TP=39
Число ложных находок, FP=1905
Число ненайденных белков подсемейства, FN=0
Чувствительность TP/(TP+FN)=1
Селективность TP/(TP+FP)=0,02

Селективность данного профиля получилась лучше предыдущего (правда, порог-то я брала 2) - в данном случае она 0,02, а была 0,0015(у моего паттерна она равна 0,38). Чувствительность зато выше всяких похвал - 1, в других случаях она была значительно меньше. Выходит, этот профиль лучше всех.
©