Профили

Главная

Построение профиля домена по выравниванию и находка всех представителей в банке Uniprot/SwissProt

Создание профиля

Использовала файл may26.msf
Привела к правильному формату файл:
seqret may26.msf msf::may26_1.msf
noreturn -infile may26_1.msf -outfile may26_2.msf

may26_2.msf
Добавила веса в выравнивание
pfw may26_2.msf > may26_weighted.msf
may26_weighted.msf
Создала профиль:
pfmake may26_weighted.msf /usr/share/pftools23/blosum62.cmp > may26.prf
may26.prf

Нормализация профиля

Выполнила нормализацию профиля с помощью банка случайных последоваельностей:
pfsearch –C 10 –f may26.prf /srv/databases/uniprot/sprot_shuffled.fasta | sort -nr > scores.txt
pfscale scores.txt may26.prf > scaled.prf

scaled.prf

Поиск по профилю в банке SwissProt

Для поиска по банку SwissProt использовала нормализованный профиль(порог нормализованного веса: 300).
pfsearch -C 300.0 -f scaled.prf /srv/databases/uniprot/sprot.fasta | sort -nr > may300.xls

Получила 1581 результат.
Построила график весов находок pfsearch. Ступеньку на этом графике можно интерпретировать как порог нормализованного веса для находок.
У меня получилось всего 3 находки, содержащих мой домен. Что достаточно странно, и, видимо, говорит об ошибке(?).
Построила ROC-кривую.
Excel файл.


©Eliseeva Julia