1. Создание паттернов аминокислотных последовательностей

Вначале я взяла для анализа не очень, как потом выяснилось, подходящий участок, выглядящий так:



Однако в процессе продумывания паттернов выяснилось, что по ним находится еще множество неродственных белков, соответственно, этот участок специфичным не является. Поэтому пришлось взять другой:



По нему и была составлена таблица.

Полученные паттерны


Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько)
Фрагмент последовательности PARSCVEVARLPKDALVEIE 1 Найдена одна, собственно, начальная последовательность.
Сильный PAR-[SAV]-[CTA]-[VY]-[GEQ]-V-[ASKQ]-[ARGEK]-LP-[KRL]-[DNG]-[AVS]-[KLEG]-[VIL]-EI-[ED] 17 Да, кроме них найдены еще некоторые родственные белки (см. ниже).
Слабый P-[AT]-R-x-[CTA]-[VYIF]-[AKGEQ]-[VCA]-x(2)-[LIVMA]-[PKND]-x(3)-{D}-[VIL]-E-[IM]-[EDAKV] 91 Да, найдены почти все достаточно родственные бкли (см. ниже).


При составлении первого паттерна я просто скопировала выбранный участок последовательности. Нашлась только она, что не может не радовать.
При составлении второго паттерна пришлось добавить некоторую вариативность, опираясь только на последовательности выбранных белков. Нашлись не только эти, но и другие белки, что легко объясняется способом выполнения предыдущего задания: так как в нем было найдено множество *очень* похожих друг на друга белков, я отбирала не все, а только по одному из каждой совсем схожей группы. При применении данного паттерна находятся все группы таких схожих белков, а так же аналогичные белки некоторых других организмов.
Третий паттерн был составлен на основе анализа результатов BLAST для моего исходного белка. В принципе, я просто добавляла изменяющиеся аминокислоты в [...], если в скобках получилось >5 аминокислот, заменила их на соответствующее количество "х". Одно исключение ({D}) было введено искусственно, для того, чтобы не находился неродственный белок MMF1_YEAST. Радует, что было найдено множество белков RUTC (представители семейства) и, по сути, большинство белков, входящих в результаты поиска по BLAST с e < 1e-15. Результат поиска по последнему паттерну.

2. Все описанные в PROSITE мотивы в заданном белке RIDA_BACSU

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн Специфична ли подпись? Сколько мотивов нашлось в белке?
PS01094 UPF0076 Uncharacterized protein family UPF0076 signature профиль [PA]-[ASTPV]-R-[SACVF]-x-[LIVMFY]-x(2)-[GSAKR]-x-[LMVA]-x(5,8)-[LIVM]-E-[MI] специфична 1
PS00008 MYRISTYL N-myristoylation site паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}[GistheN-myristoylationsite] неспецифична 1
PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site паттерн [ST]-x-[RK] неспецифична 1
PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site паттерн [ST]-x(2)-[DE][SorTisthephosphorylationsite] неспецифична 1


Опять же, очень приятно, что выбранный в первом задании фрагмент оказался специфичным профилем для данного семейства белков.




При проверке работы Вы могли обратить внимание, что мне был дан белок с другим названием - YABJ_BACSU. Дело в том, что за те полгода, как я занимаюсь белком, его успели изучить получше и присвоить ему другой идентификатор - RIDA. Довольно интересно и уникально)