Пакет Pftools

    При выполнении этого задания я испотльзовала тоже выравнивание, что было взято в прошлом задании.
  1. Для того, чтобы приготовить входной файл msf, использовалась команда noreturn:
  2. Рассчет веса строк выравнивания программаой pfw.
    pfw aligned.noreturn
    pfw.msf
    Значения весов изменились (в исходном файле они были равны 1.00)
  3. Создание профиля програмой pfmake.
    pfmake pwf.msf blosum62.cmp
    Выходной файл
  4. Подготовка файла с последовательностями в fasta-формате, в которых будет проводиться поиск.
    seqret sw-org:bacteria bac.fasta
  5. Поиск по профилю.
    pfsearch -C2.0 -f pfmake bac.fasta > my.pfsearch
  6. Анализ результатов.
    Найдена последовательность
    Вес > 50 - 99
    Вес > 40 - 661
    Вес > 30 - 767
    Вес > 20 - 778
    Вес > 3 - 817
    Вес > 2 - 1944 (всего)
    Excel
    Число верных находок, TP=39
    Число ложных находок, FP=1905
    Число ненайденных белков подсемейства, FN=0
    Чувствительность TP/(TP+FN)=1
    Селективность TP/(TP+FP)=0,02





    Селективность данного профиля получилась лучше предыдущего (правда, порог-то я брала 2) - в данном случае она 0,02, а была 0,0015(у моего паттерна она равна 0,38). Чувствительность зато выше всяких похвал - 1, в других случаях она была значительно меньше. Выходит, этот профиль лучше всех.

    1. ©