На главную
К четвертому семестру

Prosite & patterns

PS01109
Рибосомальный белок L10 - один из протеинов большой субъединицы рибосомы. Содержит от 162 до 185 а.к. остатков, найден только в эубактериях. Для паттерна был выбран N концевой домен.

[KNQ]-x(2)-{K}-x(3)-{A}-{L}-x(9)-[LIVMFY]-x(2)-[DENHR]-x(2)-[GS]-[LIVMF]-[STDNQC]-[VTA]-x-[DENQKHPSA]-[LIVMSAD]-x(2)-[LIMF]-[KR]

PS01109
Всего находок 532 в 532 разных последовательностях.
Число находок среди известных белков 528/528.
Число находок в потенциальных 0/0.
Число ложных находок 4 в 4 последовательностях.
Колиичество пропущеных известных находок: 172.
Точность 99.25%
Чувствительность 75.43%





Был выбран таксон Firmicutes

Были взяты все приведенные ранее организмы из этого таксона, а так же по 2-6 организмов из всех остальных таксонов.

Так вышлядит блок этого выравнивания, который использовался для составления паттерна:



И отдельно для выбраного таксона:




Был составлен следующий паттерн: [IV]-x(3)-F-x(6)-[LVI]-x-[VLI]-K-x-G-x-[IMV], который находит 115 последовательностей, против 107, находимых просайтом, из них: найдены все 107 просайтовских и 8 лишних.

Создавался паттерн следующим образом: был написан строгий паттерн по все блоку, а затем он укорачивался и ослаблялся до приемлемого уровня отклонения (в 10%). Была замечена одна странность: был этап, когда укорачивание паттерна, без каких-либо других изменений, делало его формально более строгим, т.е. находилось меньше последовательностей. Объяснить затрудняюсь.