Профили
Главная
Построение профиля домена по выравниванию и находка всех представителей в банке Uniprot/SwissProt
Создание профиля
Использовала файл may26.msf
Привела к правильному формату файл:
seqret may26.msf msf::may26_1.msf
noreturn -infile may26_1.msf -outfile may26_2.msf
may26_2.msf
Добавила веса в выравнивание
pfw may26_2.msf > may26_weighted.msf
may26_weighted.msf
Создала профиль:
pfmake may26_weighted.msf /usr/share/pftools23/blosum62.cmp > may26.prf
may26.prf
Нормализация профиля
Выполнила нормализацию профиля с помощью банка случайных последоваельностей:
pfsearch –C 10 –f may26.prf /srv/databases/uniprot/sprot_shuffled.fasta | sort -nr > scores.txt
pfscale scores.txt may26.prf > scaled.prf
scaled.prf
Поиск по профилю в банке SwissProt
Для поиска по банку SwissProt использовала нормализованный профиль(порог нормализованного веса: 300).
pfsearch -C 300.0 -f scaled.prf /srv/databases/uniprot/sprot.fasta | sort -nr > may300.xls
Получила 1581 результат.
Построила график весов находок pfsearch. Ступеньку на этом графике можно интерпретировать как порог нормализованного веса для находок.
У меня получилось всего 3 находки, содержащих мой домен. Что достаточно странно, и, видимо, говорит об ошибке(?).
Построила ROC-кривую.
Excel файл.
©Eliseeva Julia