Выбор подсемейства и составление Gold Standart.
Сначала из выравнивания выборки выделили последовательности подсемейства PF00615 из
белков таксона Chordata с доменной архитектурой 2 - RGS+Pkinase
в отдельный файл, сохранив его в стокгольмском формате с помощью программы JalView.
Построение профиля
Для построения профиля сервере kodomo воспользовались пакетом HMMER 3.0 и программой hmmbuild:
hmmbuild gold.hmm gold.stk
Поиск по белкам Uniprot
Программой hmmsearch проведили поиск полученным профилем по всем белкам Uniprot
FASTA, включающим хотя бы один домен семейства:
hmmsearch -o search.out gold.hmm rgs.fasta
Оценка параметров профиля
В таблице приведены характеристики работы профиля:
E-value = 10-5
TP = 6;
FP = 268;
TN = 331
FN = 4;
R (чувствительность) = 0,6
PPV ~= 0,0219
Выводы
Полученный профиль обладает невысокой чувствительностью (0,6) и крайне низкой избирательностью
(0,0219) при E-value равном 10-5.