Профили

Построение профиля домена по выравниванию, находка всех представителей в банке Uniprot/SwissProt

Для построения профиля pftools было использовано выравнивание.

  1. Изначально убераем символы возврата строки, используя программу noreturn пакета EMBOSS.
  2. Добавляем веса последовательностям в выравнивание с помощью команды:
    pfw edit-n.msf > edit-w.msf.
  3. Создаем профиль:
    pfmake edit-w.msf /usr/share/pftools23/blosum62.cmp > edit.prf.
  4. Создаем нормализованный профиль:
    pfsearch -C 10 -f edit.prf /srv/databases/uniprot/sprot_shuffled.fasta | sort -nr > scores.txt
    pfscale scores.txt edit.prf > scaled.prf
    .
  5. Находим в SwissProt всех представителей домена, используя поиск по профилю:
    pfsearch -C 5.5 -f scaled.prf /srv/databases/uniprot/sprot.fasta | sorf -nr > scores1.txt
  6. Полученный файл scores1.txt проанализировали по параментам: соответствие находками PFAM, построен график весов находок pfsearch, ROC-кривую. В итоге получили таблицу.

    С помощью Excel был построен график нормализованного веса находок, порогом выбрано значение в 3502.
    Была построена ROC-кривая, подтверждающая выбранный порог.

    Проанализировав результаты полученные с помощью профиля нельзя сделать вывод, что профиль хороший, так как было сделано 25 ошибок первого рода.

  7. © Butusova Anna,2013