Пакет Pftools

Создание (с помощью пакета Pftools) профиля, распознающего белки семейства, описанного в упражнении 1 позапрошлого занятия, принадлежащие отделу Firmicutes:

Для создания профиля был взят файл, содержащий фрагмент выравнивания, использовавшийся для создания паттерна.
Программы пакета pftools работают с файлами, имеющими конец строки, принятый в UNIX. При помощи программы noreturn был создан файл с фрагментом выравнивания; у файла отсутствуют символы "carriage return" в концах строк.
Веса строк выравнивания были рассчитаны программой pfw. Полученный файл отличается от исходного тем, что изменились веса (в исходном файле веса всех строк были равны=1.0).
Профиль был создан программой pfmake. (использовалось взвешенное выравнивание и матрица /usr/share/pftools23/blosum62.cmp)

Поиск по профилю во всех бактериальных белках из Swiss-Prot:

Файл со всеми бактериальными белками из Swiss-Prot был подготовлен командой seqret sw-org:bacteria bacteria.fasta.
Поиск по профилю был проведен программой pfsearch c порогом 2.
Результаты поиска.

Анализ результатов поиска:

Результаты были обработаны при помощи MS Excel. Обработанные результаты.
Сравнение списка находок при различных порогах со списком белков, которые паттерн должен находить в идеале, было произведено при помощи скрипта. Результаты работы скрипта.
Из результатов работы видно, что при пороге 20.43 селективность профиля близка к селективности паттерна, созданного на позапрошлом занятии. Чувстительность профиля при пороге 20.43 (0.197452229299363) значительно ниже чувствительности паттерна (0,7820512820512821).

ROC-кривая профиля лежит ниже, чем ROC-кривая профиля, созданного на предыдущем занятии.

главная страница
©Настя Гуляева, 2009