На главную

Занятие 12. Построение профиля подсемейства

Было выбрано подсемейство из 8 последовательностей, относящихся к Ecdysozoa и имеющих одну доменную архитектуру состоящую из доменов DCB и DUF1981, а также несколько диагностических позиций, которые можно видеть в выравнивании:


Рисунок 1. Выравнивание подсемейства

Для построения и калибровки профиля использовались программы пакета HMMER 2.3.2:
  1. hmm2build myprofile partalign.mfa — построение профиля по выравниванию подсемейства;
  2. hmm2calibrate myprofile — калибровка полученного профиля myprofile;
  3. hmm2search myprofile uniprot-pf16213.fasta > hits - поиск по списку последовательностей всех последовательностей UniProt, содержащих домен DCB.

Полученный файл hits с находками далее анализировался при помощи средств MS Excel.
По имеющимся данным были построены гистограмма и ROC-кривая.


Рисунок 2. Гистограмма весов находок


Рисунок 3. ROC-кривая

На основании построенной ROC-кривой было выбрано пороговое значение E-value. Критерий выбора - максимум разности [Чувствительность - (1-Специфичность)]. Полученный порог E-value 2,9E-128. В таблице ниже представлены находки с разделением выше/ниже порогового значения и принадлежностью к семейству.


Таблица 1. Разделение находок при пороге E-value 2,9E-128.