Занятие 12. Построение профиля подсемейства
Было выбрано подсемейство из 8 последовательностей, относящихся к Ecdysozoa и имеющих одну доменную архитектуру состоящую из доменов DCB и DUF1981, а также несколько диагностических позиций, которые можно видеть в выравнивании:
Рисунок 1. Выравнивание подсемейства
Для построения и калибровки профиля использовались программы пакета HMMER 2.3.2:
- hmm2build myprofile partalign.mfa — построение профиля по
выравниванию подсемейства;
- hmm2calibrate myprofile — калибровка полученного профиля
myprofile;
- hmm2search myprofile uniprot-pf16213.fasta > hits - поиск по
списку последовательностей
всех последовательностей UniProt, содержащих домен DCB.
Полученный файл hits с находками
далее анализировался при помощи средств MS Excel.
По имеющимся данным были построены гистограмма и ROC-кривая.
Рисунок 2. Гистограмма весов находок
Рисунок 3. ROC-кривая
На основании построенной ROC-кривой было выбрано пороговое значение E-value. Критерий выбора - максимум разности [Чувствительность - (1-Специфичность)].
Полученный порог E-value 2,9E-128.
В таблице ниже представлены находки с разделением выше/ниже порогового значения и принадлежностью к семейству.
Таблица 1. Разделение находок при пороге E-value 2,9E-128.