Профили
Построение профиля домена по выравниванию, находка всех представителей в банке Uniprot/SwissProt
Для построения профиля pftools было использовано выравнивание.
- Изначально убераем символы возврата строки, используя программу noreturn пакета EMBOSS.
- Добавляем веса последовательностям в выравнивание с помощью команды:
pfw edit-n.msf > edit-w.msf.
- Создаем профиль:
pfmake edit-w.msf /usr/share/pftools23/blosum62.cmp > edit.prf.
- Создаем нормализованный профиль:
pfsearch -C 10 -f edit.prf /srv/databases/uniprot/sprot_shuffled.fasta | sort -nr > scores.txt
pfscale scores.txt edit.prf > scaled.prf.
- Находим в SwissProt всех представителей домена, используя поиск по профилю:
pfsearch -C 5.5 -f scaled.prf /srv/databases/uniprot/sprot.fasta | sorf -nr > scores1.txt
- Полученный файл scores1.txt проанализировали по параментам: соответствие находками PFAM, построен график весов находок pfsearch, ROC-кривую. В итоге получили таблицу.

С помощью Excel был построен график нормализованного веса находок, порогом выбрано значение в 3502.
Была построена ROC-кривая, подтверждающая выбранный порог.

Проанализировав результаты полученные с помощью профиля нельзя сделать вывод, что профиль хороший, так как было сделано 25 ошибок первого рода.
© Butusova Anna,2013