Назад

Информация о доменах:
AC - PF01987, ID - AIM24, число последовательностей по данным Pfam - 6170
AC - PF02342, ID - TerD, число последовательностей по данным Pfam - 1041

g

На Pfam содержится 190 последовательностей, содаржащих только эти два домена. По данным UniProt их 695. Таблица белков с выбранной архитектурой. На первой странице все белки, на второй выборка белков с длинами от 527 до 575 среди представителей семейств Frankiaceae, Nocardiaceae, Streptomycetaceae. Гистограмма длин белков приведена там же. Последователбьности белков представлены здесь. Эти последовательности были выравнены с помощью MUSCLE, и в JalView выравнивание было обработано. Обработанно выравнивание здесь. Команды для построения и колибровки hmm-профиля:
hmm2build hmm.hmm alignment.fasta
hmm2calibrate hmm.hmm

Получился файл. Для проверки профиля были скачаны последовательности всех белков, содержащие домен AIM24, т.к. для него есть 21684 последовательности, а для второго домена 26183. Команда поиска:
hmm2search hmm.hmm aim24.gz среди результатов отбираем тоглько те, у кого E-value меньше 0,01

Таблица с результатами поиска по профилю на странице 3 вместе со ступеньками Score и кривой ROC. Порог - 679,1. Предсказанные белки с нашей архитектурой - 259, отвергнутые - 48. Предсказанные белки не с нашей архитектурой - 309, отвергнутые белки не с нашей архитектурой - 21068. Чувствительнсоть составила 259/(259 + 48) = 84%, а специфичность 21068/(21068+309) = 98,5%. Иы видим, что чувствительность и особенно специфичность довольно высокие.