Назад
Информация о доменах:
AC - PF01987, ID - AIM24, число последовательностей по данным Pfam - 6170
AC - PF02342, ID - TerD, число последовательностей по данным Pfam - 1041
На Pfam содержится 190 последовательностей, содаржащих только эти два домена. По данным UniProt их 695. Таблица
белков с выбранной архитектурой. На первой странице все белки, на второй выборка белков с длинами от 527 до 575 среди представителей семейств Frankiaceae,
Nocardiaceae, Streptomycetaceae. Гистограмма длин белков приведена там же. Последователбьности белков представлены здесь.
Эти последовательности были выравнены с помощью MUSCLE, и в JalView выравнивание было обработано. Обработанно выравнивание здесь.
Команды для построения и колибровки hmm-профиля:
hmm2build hmm.hmm alignment.fasta
hmm2calibrate hmm.hmm
Получился файл. Для проверки профиля были скачаны последовательности всех белков, содержащие домен AIM24, т.к. для него есть
21684 последовательности, а для второго домена 26183. Команда поиска:
hmm2search hmm.hmm aim24.gz среди результатов отбираем тоглько те, у кого E-value меньше 0,01
Таблица с результатами поиска по профилю на странице 3 вместе со ступеньками Score и кривой ROC. Порог - 679,1.
Предсказанные белки с нашей архитектурой - 259, отвергнутые - 48. Предсказанные белки не с нашей архитектурой - 309, отвергнутые белки не с нашей
архитектурой - 21068. Чувствительнсоть составила 259/(259 + 48) = 84%, а специфичность 21068/(21068+309) = 98,5%. Иы видим, что чувствительность и особенно
специфичность довольно высокие.