Профили


Выбор подсемейства и составление Gold Standart.

Сначала из выравнивания выборки выделили последовательности подсемейства PF00615 из белков таксона Chordata с доменной архитектурой 2 - RGS+Pkinase в отдельный файл, сохранив его в стокгольмском формате с помощью программы JalView.

Построение профиля

Для построения профиля сервере kodomo воспользовались пакетом HMMER 3.0 и программой hmmbuild:

hmmbuild gold.hmm gold.stk

Поиск по белкам Uniprot

Программой hmmsearch проведили поиск полученным профилем по всем белкам Uniprot FASTA, включающим хотя бы один домен семейства:

hmmsearch -o search.out gold.hmm rgs.fasta

Оценка параметров профиля

В таблице приведены характеристики работы профиля:

E-value = 10-5
TP = 6;
FP = 268;
TN = 331
FN = 4;
R (чувствительность) = 0,6
PPV ~= 0,0219

Выводы

Полученный профиль обладает невысокой чувствительностью (0,6) и крайне низкой избирательностью (0,0219) при E-value равном 10-5.