Паттерны и банк PROSITE
Встречаемость слова "dream" в банке SwissProt.
Предскажем сколько раз будет встречаться слово "dream" в банке SwissProt методами комбинаторики. Встречаемость слова будет равна произведению количеству всех аминокислотных остатков в банке на процент содержания каждой из аминокислот слова, ответ: 74,85. Расчет привден ниже.
191670831*0,0545*0,0553*0,0675*0,0825*0,0242=74,85
Можно проверить через PROSITE сколько раз данное слово реально встречается в последовательностях, ответ: 60.
Такие результаты говорят о том, что математическое предсказание почти выполняется, и последовательность dream не несет особой функциональной нагрузки.
Поиск вероятных гомологов белка KAD_BACSU в SwissProt с помощью паттернов
Для составления паттернов я пользовался уже отредактированным выравниванием, поскольку оно короче и удобнее, а от полного отличается всего на 5 последовательностей.
Были созданы два паттерна - сильный (более точный) и слабый (менее точный), информация о них приведена в таблице ниже.
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из вашего выравнивания найдены? |
Сильный |
x-[PNQ]-G-[ASV]-G-K-[GTSD]-T-x(16,18)-[GS]-[DA]-x(2)-R |
761 |
|
Слабый |
[DN]-G-[YMIFCV]-[PIV]-R-[TSND]-x(2)-Q-[AGMVL]-x(11,17)-[VIAMT]-[VIFL]-x(11,12)-R-x(3)-R |
789 |
|
Казалось бы, второй паттерн должен быть сильнее из-за большей длины, однако, получается, что перевешивает более точное задание аминокислот в первом паттерне.
Мотивы PROSITE в последовательности белка KAD_BACSU
Рассмотрим встречаемость мотивов в аденилаткиназе. Помимо мотива ADENYLATE KINASE, рассмотрим неспецифические часто встречающиеся мотивы. Информация о резудьтатах поиска приведена ниже в таблице.
Идентификатор документа Prosite (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи |
Паттерн |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
PS00113 |
ADENYLATE_KINASE |
Белок, катализирующий обратимую реакцию: MgATP + AMP = MgADP + ADP |
Паттерн |
[LIVMFYWCA]-[LIVMFYW](2)-D-G-[FYI]-P-R-x(3)-[NQ] |
Неспецифична |
1 |
PS00008 |
MYRISTYL |
Сайт N-миристоилирования |
Паттерн |
G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} |
Неспецифична |
2 |
PS00006 |
CK2_PHOSPHO_SITE |
Сайт фосфорилирования казеинкиназы |
Паттерн |
[ST]-x(2)-[DE] |
Неспецифична |
3 |
PS00009 |
AMIDATION |
Сайт амидирования |
Паттерн |
x-G-[RK]-[RK] |
Неспецифична |
1 |
© Марк Меерсон, 2013
Последнее обновление: 03.05.2013