Вернуться на страницу семестров

1)Содержит ли Swissprot послание инопланетян?

Вероятная встреча моего слова (Alarm) в базе Prosite (перемножение частот букв слова и количества букв) - 0,0825*0,0825*0,0966*0,053*0,0242*191670831 = 16 раз. Если ввести в запрос A-L-A-R-M , результат будет: "The search term has not been found in PROSITE entries." Реальное количество значительно меньше предугадонного, оно и не удивительно ведь A-L-A-R-M, алифатические остатки и сразу A и L подряд, довольно сложная комбинация.

2)"Cильный" и "слабый" паттерны

Создал "сильный" и "слабый" паттерны для поиска гомологов своего белка в банке SwissProt, результаты поиска представил в таблице ниже.


Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot и Trembl найден мотив, удовлетворяющий паттерну Сколько последовательностей из моего выравнивания найдено Вероятность получения случайной последовательности в Swiss-Prot по такому паттерну
Сильный [IV]-[AIV]-[ITV]-[PT]-x-W-x-P-H-[SW]-x-[FY]-x(2)-[FY]-x-L-x(2)-L-x-D-P-K 2 2 1.762506e-10
Слабый [IV]-x(4)-W-x-P-H-[SW]-x(4)-[FYW] 7 2 0.53
Чем сильнее паттерн, тем меньше находок(как в моем случае всего 2 находки, из которых одна мой белок OPUAC_BACSU). И наоборот, чем слабее паттерн, тем больше находок. Хотя и в сильном, и в слабом паттернах последовательность белка OPUAC_BACSU встретилась один раз.

3)Поиск мотивов PROSITE в последовательности белка OPUAC_BACSU

Мотив - это определенный консервативный участок последовательности, несущий какую-либо функцию. В банке PROSITE есть информация о различных мотивах. Информация о которых ниже, в таблице.
Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (если это паттерн) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00008 MYRISTYL N-myristoylation site Паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} нет 5
PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site Паттерн [ST]-x(2)-[DE] нет 7
PS00001 ASN_GLYCOSYLATION Protein kinase C phosphorylation site Паттерн N-{P}-[ST]-{P} нет 2
PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site Паттерн [ST]-x-[RK] нет 4
PS00007 TYR_PHOSPHO_SITE Tyrosine kinase phosphorylation site Паттерн [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y нет 1
PS51257 PROKAR_LIPOPROTEIN Prokaryotic membrane lipoprotein lipid attachment site profile Профиль - да 1