Пакет Pftools 
    Создание (с помощью пакета Pftools) профиля, распознающего белки семейства, описанного в упражнении 1 позапрошлого занятия, принадлежащие отделу Firmicutes: 
        Для создания профиля был взят файл, содержащий фрагмент выравнивания, использовавшийся для создания паттерна.
   
 Программы пакета pftools работают с файлами, имеющими конец строки, принятый в UNIX. При помощи программы noreturn был создан 
        файл с фрагментом выравнивания; у файла отсутствуют символы "carriage return" в концах строк.
   
 Веса строк выравнивания были рассчитаны программой pfw.
        Полученный файл отличается от исходного тем, что изменились веса (в исходном файле веса всех строк были равны=1.0). 
   
 Профиль был создан программой pfmake. (использовалось взвешенное выравнивание и матрица /usr/share/pftools23/blosum62.cmp) 
    Поиск по профилю во всех бактериальных белках из Swiss-Prot:
        Файл со всеми бактериальными белками из Swiss-Prot был подготовлен командой seqret sw-org:bacteria bacteria.fasta.
   
 Поиск по профилю был проведен программой pfsearch c порогом 2. 
   
 Результаты поиска. 
    Анализ результатов поиска:
            Результаты были обработаны при помощи  MS Excel. Обработанные результаты.
        
Сравнение списка находок при различных порогах со списком белков, которые паттерн должен находить в идеале, 
            было произведено при помощи скрипта. Результаты работы скрипта. 
        
Из результатов работы видно, что при пороге 20.43 селективность профиля близка к селективности паттерна, созданного на позапрошлом занятии.
            Чувстительность профиля при пороге 20.43 (0.197452229299363) значительно ниже чувствительности паттерна (0,7820512820512821). 
        
 
        
ROC-кривая профиля лежит ниже, чем ROC-кривая профиля, созданного на предыдущем занятии. 
 главная страница 
©Настя Гуляева, 2009