Профили
Построение профиля выравнивания
Из выравнивания, полученного в pr11 было извлечено подсемейство, представленное на рис.1. (ссылка: pr12_1.fasta).
С помоью программ hmm2build и hmm2calibrate был построен профиль и осуществлена его калибровка. По откалиброванному профилю проводился поиск доменов по всем
белкам из Uniprot, содержащих данный домен.
 |
Рис. 1. Изображение клады дерева, выбранной в качестве подсемейства |
Полученные результаты были перенесены в таблицу Excel. Среди находок в отдельном столбце были отмечены представительи подсемейства. На основе полученных данных
была построена ROC-кривая. Она представлена на рис.2.
Расчеты чувствительности и специфичности, необходимые для построения ROC-кривой, а также исходные данные доступны по ссылке: pr12.xlsx
.
 |
Рис. 2.ROC-кривая |
По ROC-кривой было определено пороговое значение E-value. по нему можно судить о вхождении последовательности в подсемейство.
E-value порога = 4,8E-35. При этом пороге значения чувствительности и специфичности максимальны (1 и 0,999).
Характеристика HMM-профиля с выбранным порогом E-value приведена в Таблице 1.
Таблица 1.Характеристика HMM-профиля с порогом E-value 4,8E-35
|
Принадлежит подсемейтсву |
Не принадлежит |
Сумма |
Выше порога |
9 |
84 |
93 |
Ниже порога |
1 |
3600 |
3601 |
Сумма |
10 |
3684 |
3694 |
По табл.1 можно сделать вывод о том что чувствительность профиля при данном пороге довольно высокая. 9 последоательностей из 10 оказались выше порога.
Вместе с тем количество последовательностей, определенных как принадлежащие семейтсву, но на самом деле нет - довольно мало, учитывая общее количество последовательностей.
Поэтому можно считать, что с помощью данного профиля можно определять принадлежность к подсемейству.