PROSITE


Содержит ли Swissprot послание инопланетян

Теоретическое предсказание
Нам известна частота встречаемости каждой аминокислоты. Следовательно, мы можем узнать гипотетическую частоту встречаемости слова "dress" путем перемножения частот встречаемости "букв"(однобуквенные коды аминокислот) данного слова.
P=0.0545*0.0553*0.0675*0.0656*0.0656=8.75*10-7
Далее мы умножаем полученную вероятность на количество "слов"(остатков) всего банка.
N=8.75*10-7 * 191 670 831 = 167.71
То есть мы ожидаем примерно 168 раз встретить данное слово.

Факт
Для поиска данного слова воспользумся синтаксисом паттернов, ищем D-R-E-S-S. Нашлось 109 паттернов в 108 последовательностях банка Swissprot.

Выводы
Паттерн встречается с меньшей частотой, чем предполагалось. Возможно, это связано с тем, что данный порядок аминокислотных остатков редко встречается в последовательностях, но в основном порядок остатков в белковых последовательностях случайный.

Поиск вероятных гомологов THIE_BACSU в банке SwissProt с помощью паттернов

Для построения "сильного" и "слабого" паттернов было использованы результаты множественного выравнивания из практикума №8 (Рис.1). От "сильного" паттерна, на которого наложено много условий, ожидается, что он пропустит многих гомологов, а от "слабого" - что будет очень много находок. Паттерны и результаты представлены в таблице 1.

Таблица 1. Результаты поиска гомологов по паттернам

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько)
Сильный [VLI]-x-G-G-[VAL]-T-[LIVM]-x-Q-x-R-[ED]-K 37 Нет, найдено 2 последовательности из выравнивания (исследуемый THIE_BACSU и белок, принадлежащий Arabidopsis thaliana)
Слабый [AVI]-x(2)-[AVIL]-R-x-[ALI]-[LI]-x(4)-[GP]-[PKND] 692 Нет, найдено 6 последовательностей из выравнивания, включая THIE_BACSU


К сожалению, лишь малая часть последовательностей была найдена с помощью обоих типов паттернов. Это связано с тем, что при составлении выборки поиск проводился по базе данных RefSeq, а нынешний поиск по Swiss-Prot.

Поиск всех мотивов PROSITE в последовательности белка THIE_BACSU

С помощью сервера ExPASy через PROSITE был произведен поиск с целью выявления мотивов в белке THIE_BACSU. Специфичных мотивов не найдено. Pезультаты представлены в таблице 2.

Таблица 2. Результаты поиска мотивов в белке THIE_BACSU

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (если это паттерн) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00008 MYRISTYL Сайт N-миристоилирования Паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} Неспецифична 3
PS00001 ASN_GLYCOSYLATION Сайт N-гликозилирования Паттерн N-{P}-[ST]-{P} Неспецифична 1
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеинкиназы II Паттерн [ST]-x(2)-[DE] Неспецифична 5
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилирования протеинкиназы С Паттерн [ST]-x-[RK] Неспецифична 3
PS00004 CAMP_PHOSPHO_SITE Сайт фосфорилирования цАМФ- и цГМФ-зависимых протеинкиназ Паттерн [RK](2)-x-[ST] Неспецифична 1
PS00007 TYR_PHOSPHO_SITE Сайт фосфорилирования тирозинкиназы Паттерн [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y Неспецифична 1


© Novikova Maria, 2013
Последнее обновление: 02.03.2013