На главную

Создание паттерна по выравниванию семейства белков

По запросу RS14_BACSU в БД Prosite нашелся только один паттерн:
[RP]-x(0,1)-C-x(11,12)-[LIVMF]-{L}-[LIVMF]-[SC]-[RG]-x-{D}-{PK}-[RN],
название которого можно перевести как "характерные особенности рибосомального белка S14". Рибосомальный белок S14 - один из белков малой рибосомальной субъединицы. Известно, что в Escherichia coli он определяет конформацию 16S рРНК. S14 - белок из 53-115 аминокислотных остатков. Этот паттерн основан на нескольких сонсервативных позициях расположенных в середине белка. Паттерн находит 790 последовательностей, 32 из них неправильно, и не находит еще 210. Точность 96,11%, чувствительность 79%.

Паттерн для подсемейства:
R-X(0,1)-C-[AEKRLQSMT]-[RIVKL]-[CT]-G-R-[PSA]-[HR]-[SAG]-[VY]-[YILMS]-[QRGK]-[KDQ]-F-[KDGEHQ]-[VIML]-[CS]-R-[ILVH]-[RCAK]-[FL]-R
Находит все 148 последовательностей таксона Firmicutes, удовлетворяющих первому паттерну, и еще 54 лишних последовательности. Результаты поиска можно увидеть здесь. Работать показалось удобнее с выравниванием, выданным сайтом Prosite для исходного паттерна. выравнивание в формате msf Новый паттерн представляет из себя полное перечисление всех возможных аминокислотных остатков в каждой позиции для последовательностей таксона Firmicutes, и даже он выдает уже 54 лишних последовательности. Возможно, с этой проблеммой удалось бы справиться, добавив в паттерн еще несколько позиций.



© Червонцева,2011