Создание паттерна по выравниванию семейства белков

Для RS5_BACSU нашлись профиль S5_DSRBD и паттерн
G-[KRQEA]-x(3)-[FYVIM]-x-[ACVTI]-x(2)-[LIVMA]-[LIVMAT]-[AG]-[DN]-x(2,3)-G-x-[LIVMA]-[GS]-x-[SAG]-x(5,6)-[DEQGHS]-[LIVMARFY]-x(2,3)-[AS]-[LIVMFRY]
Не находятся: 21
лишние: 0
точность: 100%
чувствительность: 97,13

S5- рибосомальный белок из малой субъединицы. У E.coli он важен для сборки и функционирования 30 S субъединицы. Мутации S5 учащают ошибки в трансляции.

Кристаллическая структура S5 - два отдельных домена: N-концевой домен, структурно гомологичный домену dsRBD (&alpha-&beta-&alpha), взаимодействующему с 16S pPHK.
и С-концевой домен, состоящий в основном из спиралей и взаимодействующий с S8.

В это семейство входят белки S5 бактерий, цианеллы, хлоропластов красных водорослей, митохондрий грибов,
S2 млекопитающих, Caenorhabditis elegans, дрозофилы и растений и S2 дрожжей.

B S5 166-254 a.o. N-концевой домен богат глицином и является консервативным участком.

Предварительный вид выравнивания семейства белков

Часть выравнивания.

Попробуем построить паттерн по участку, где консервативные позиции внутри подсемейства из Firmicutes выделены фиолетовым (координаты выравнивания 60-108).
V-[AT]-[VI]-N-R-[IV]-[TA]-KVVKGGRR-[QMFL]-RF-[ATS]-ALVVVGDK-[KN]-G-[HR]-VGFGTGKA-[TQ]-EVP-[ED]-AI-[RK]-KA
С таким паттерном находок при поиске по всем бактериям в разы меньше, чем при поиске по Firmicutes со старым паттерном, поэтому придется ослабить, например, ориентируясь на контрольные последовательности.
V-[ATR]-[VI]-N-R-[IV]-[TA]-KVVKGGRR-[QMFL]-[RS]-F-[ATS]-ALVVVGDK-[KN]-G-[HRTM]-VG-[FV]-G-[TY]-GKA-[TQRK]-EVP-[EDLA]-AI-[RKSA]-K[AG]
Результат аналогичный.

Из 113 ожидаемых в таксоне белков паттерн находит 46 и ничего не находит за пределами таксона. Т.о.: