На главную
Создание паттерна по выравниванию семейства белков
По запросу RS14_BACSU в БД Prosite нашелся только один паттерн:
[RP]-x(0,1)-C-x(11,12)-[LIVMF]-{L}-[LIVMF]-[SC]-[RG]-x-{D}-{PK}-[RN],
название которого
можно перевести как "характерные особенности рибосомального белка S14". Рибосомальный белок S14 -
один из белков малой рибосомальной субъединицы. Известно, что в Escherichia coli он определяет
конформацию 16S рРНК. S14 - белок из 53-115 аминокислотных остатков. Этот паттерн основан
на нескольких сонсервативных позициях расположенных в середине белка.
Паттерн находит 790 последовательностей, 32 из них неправильно, и не находит еще 210.
Точность 96,11%, чувствительность 79%.
Паттерн для подсемейства:
R-X(0,1)-C-[AEKRLQSMT]-[RIVKL]-[CT]-G-R-[PSA]-[HR]-[SAG]-[VY]-[YILMS]-[QRGK]-[KDQ]-F-[KDGEHQ]-[VIML]-[CS]-R-[ILVH]-[RCAK]-[FL]-R
Находит все 148 последовательностей таксона Firmicutes, удовлетворяющих первому паттерну,
и еще 54 лишних последовательности. Результаты поиска можно увидеть здесь.
Работать показалось удобнее с выравниванием, выданным сайтом Prosite для исходного паттерна.
выравнивание в формате msf
Новый паттерн представляет из себя полное перечисление всех возможных аминокислотных остатков в каждой позиции
для последовательностей таксона Firmicutes, и даже он выдает уже 54 лишних последовательности. Возможно, с этой проблеммой удалось
бы справиться, добавив в паттерн еще несколько позиций.
© Червонцева,2011