Паттерны и банк PROSITE

Встречаемость слова "dream" в банке SwissProt.

Предскажем сколько раз будет встречаться слово "dream" в банке SwissProt методами комбинаторики. Встречаемость слова будет равна произведению количеству всех аминокислотных остатков в банке на процент содержания каждой из аминокислот слова, ответ: 74,85. Расчет привден ниже.
191670831*0,0545*0,0553*0,0675*0,0825*0,0242=74,85
Можно проверить через PROSITE сколько раз данное слово реально встречается в последовательностях, ответ: 60.
Такие результаты говорят о том, что математическое предсказание почти выполняется, и последовательность dream не несет особой функциональной нагрузки.

Поиск вероятных гомологов белка KAD_BACSU в SwissProt с помощью паттернов

Для составления паттернов я пользовался уже отредактированным выравниванием, поскольку оно короче и удобнее, а от полного отличается всего на 5 последовательностей.
Были созданы два паттерна - сильный (более точный) и слабый (менее точный), информация о них приведена в таблице ниже.

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из вашего выравнивания найдены?
Сильный x-[PNQ]-G-[ASV]-G-K-[GTSD]-T-x(16,18)-[GS]-[DA]-x(2)-R
761
 
Слабый [DN]-G-[YMIFCV]-[PIV]-R-[TSND]-x(2)-Q-[AGMVL]-x(11,17)-[VIAMT]-[VIFL]-x(11,12)-R-x(3)-R
789
 

Казалось бы, второй паттерн должен быть сильнее из-за большей длины, однако, получается, что перевешивает более точное задание аминокислот в первом паттерне.

Мотивы PROSITE в последовательности белка KAD_BACSU

Рассмотрим встречаемость мотивов в аденилаткиназе. Помимо мотива ADENYLATE KINASE, рассмотрим неспецифические часто встречающиеся мотивы. Информация о резудьтатах поиска приведена ниже в таблице.

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи Паттерн Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00113 ADENYLATE_KINASE Белок, катализирующий обратимую реакцию: MgATP + AMP = MgADP + ADP Паттерн [LIVMFYWCA]-[LIVMFYW](2)-D-G-[FYI]-P-R-x(3)-[NQ] Неспецифична 1
PS00008 MYRISTYL Сайт N-миристоилирования Паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} Неспецифична 2
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеинкиназы Паттерн [ST]-x(2)-[DE] Неспецифична 3
PS00009 AMIDATION Сайт амидирования Паттерн x-G-[RK]-[RK] Неспецифична 1

Главная страница Первый семестр Второй семестр Обо мне Ссылки

© Марк Меерсон, 2013
Последнее обновление: 03.05.2013