Учебный сайтик
Кирилла Прокаповича

Поиск семейства, подсемейства, построение hmm профиля

Я выбрал Peptidase M7, snapalysin (IPR000013). Эта группа металлопептидаз относится к пептидазному семейству M7 по классификации MEROPS (семейство снапализинов, клан MA(M)). Фолд пептидазного домена у представителей этого семейства напоминает таковой у термолизина — типичного представителя клана MA. Имея молекулярную массу около 16 кДа, внеклеточная нейтральная протеаза Streptomyces является одной из самых маленьких известных протеаз; она способна гидролизовать молочные белки. Всего белков - 2055.

Доменная архитектура - IPR000013 - IPR001254, у такой архитектуры 65 белков.

Я сделал выравнивание с помощью muscle, выделил домен и с помощью

hmmbuild --amino hmmres hmmprof ali.fasta

построил hmm профиль.

Затем с помощью

hmmsearch -o hmmres hmmprof protein-matching-IPR000013.fasta

провел поиск мотивов в белках семейства. Выдача

По результатам хорошим порогом скора является 576.7, после которого следующая находка имеет скор 431.1.

Всего - 2505, вернонайденных - 63, ложнонайденных - 0, ложноненайденных - 2, верноненайденных - 2440.

Таким образом, получилось не очень точно найти среди белков семейства, белки подсемейства.