Пакет Pftools
Создание (с помощью пакета Pftools) профиля, распознающего белки семейства, описанного в упражнении 1 позапрошлого занятия, принадлежащие отделу Firmicutes:
Для создания профиля был взят файл, содержащий фрагмент выравнивания, использовавшийся для создания паттерна.
Программы пакета pftools работают с файлами, имеющими конец строки, принятый в UNIX. При помощи программы noreturn был создан
файл с фрагментом выравнивания; у файла отсутствуют символы "carriage return" в концах строк.
Веса строк выравнивания были рассчитаны программой pfw.
Полученный файл отличается от исходного тем, что изменились веса (в исходном файле веса всех строк были равны=1.0).
Профиль был создан программой pfmake. (использовалось взвешенное выравнивание и матрица /usr/share/pftools23/blosum62.cmp)
Поиск по профилю во всех бактериальных белках из Swiss-Prot:
Файл со всеми бактериальными белками из Swiss-Prot был подготовлен командой seqret sw-org:bacteria bacteria.fasta.
Поиск по профилю был проведен программой pfsearch c порогом 2.
Результаты поиска.
Анализ результатов поиска:
Результаты были обработаны при помощи MS Excel. Обработанные результаты.
Сравнение списка находок при различных порогах со списком белков, которые паттерн должен находить в идеале,
было произведено при помощи скрипта. Результаты работы скрипта.
Из результатов работы видно, что при пороге 20.43 селективность профиля близка к селективности паттерна, созданного на позапрошлом занятии.
Чувстительность профиля при пороге 20.43 (0.197452229299363) значительно ниже чувствительности паттерна (0,7820512820512821).
ROC-кривая профиля лежит ниже, чем ROC-кривая профиля, созданного на предыдущем занятии.
главная страница
©Настя Гуляева, 2009