Профили

Построение профиля выравнивания

Из выравнивания, полученного в pr11 было извлечено подсемейство, представленное на рис.1. (ссылка: pr12_1.fasta). С помоью программ hmm2build и hmm2calibrate был построен профиль и осуществлена его калибровка. По откалиброванному профилю проводился поиск доменов по всем белкам из Uniprot, содержащих данный домен.


Рис. 1. Изображение клады дерева, выбранной в качестве подсемейства

Полученные результаты были перенесены в таблицу Excel. Среди находок в отдельном столбце были отмечены представительи подсемейства. На основе полученных данных была построена ROC-кривая. Она представлена на рис.2. Расчеты чувствительности и специфичности, необходимые для построения ROC-кривой, а также исходные данные доступны по ссылке: pr12.xlsx .


Рис. 2.ROC-кривая

По ROC-кривой было определено пороговое значение E-value. по нему можно судить о вхождении последовательности в подсемейство. E-value порога = 4,8E-35. При этом пороге значения чувствительности и специфичности максимальны (1 и 0,999). Характеристика HMM-профиля с выбранным порогом E-value приведена в Таблице 1.

Таблица 1.Характеристика HMM-профиля с порогом E-value 4,8E-35

Принадлежит подсемейтсву Не принадлежит Сумма
Выше порога 9 84 93
Ниже порога 1 3600 3601
Сумма 10 3684 3694

По табл.1 можно сделать вывод о том что чувствительность профиля при данном пороге довольно высокая. 9 последоательностей из 10 оказались выше порога. Вместе с тем количество последовательностей, определенных как принадлежащие семейтсву, но на самом деле нет - довольно мало, учитывая общее количество последовательностей. Поэтому можно считать, что с помощью данного профиля можно определять принадлежность к подсемейству.


© Васильева Елена, 2015