Я выбрал Peptidase M7, snapalysin (IPR000013). Эта группа металлопептидаз относится к пептидазному семейству M7 по классификации MEROPS (семейство снапализинов, клан MA(M)). Фолд пептидазного домена у представителей этого семейства напоминает таковой у термолизина — типичного представителя клана MA. Имея молекулярную массу около 16 кДа, внеклеточная нейтральная протеаза Streptomyces является одной из самых маленьких известных протеаз; она способна гидролизовать молочные белки. Всего белков - 2055.
Доменная архитектура - IPR000013 - IPR001254, у такой архитектуры 65 белков.
Я сделал выравнивание с помощью muscle, выделил домен и с помощью
hmmbuild --amino hmmres hmmprof ali.fasta
построил hmm профиль.
Затем с помощью
hmmsearch -o hmmres hmmprof protein-matching-IPR000013.fasta
провел поиск мотивов в белках семейства. Выдача
По результатам хорошим порогом скора является 576.7, после которого следующая находка имеет скор 431.1.
Всего - 2505, вернонайденных - 63, ложнонайденных - 0, ложноненайденных - 2, верноненайденных - 2440.
Таким образом, получилось не очень точно найти среди белков семейства, белки подсемейства.