Профили

Выделим из семейства Pfam подсемейство вида "домены семейства PF11612 из белков таксона A с доменной архитектурой N_methyl_2". Полученное выравнивание.

Будем пользоваться программой пакета HMMER 2.3.2 (установлен на kodomo).

Сначала построем профиль. Построим профиль по полученному выравниванию (см. выше) программой hmm2build, а программой hmm2calibrate откалибруем профиль. Получаем профиль.

Далее проверим профиль. Проведем поиск программой hmm2search откалиброванным профилем по всем белкам Uniprot, включающим хотя бы один домен выбранного подсемейства. Чтобы это сделать нужно сначала получить неооходимые белки, с помощью сервиса Retrieve в Uniprot получаем необходимые последовательности (ищем по AC). Получаем файл с последовательностями. Результат работы hmm2search - файл.

Создадим список белков, включащих домен из нашего подсемейства и назовем его "Gold standard" - gold.txt. И затем проанализируем полученные находки в hmsearch с золотым стандартом с помощью Excel.

И получаем файл и данные:

  1. R (чувствит.) 0.875
  2. PPV (избират.) 0.269230769

Так как избирательность не совсем минимальная, то работа профиля, можно сказать, выполнена удолетворительно.

Источники информации:


© Tishina Sofia, 2014