Учебный сайт Шиндяпиной А.В.

Мотивы, паттерны и профили


Создание паттернов аминокислотных последовательностей

Чтобы выполнить задание я использовала выравнивание, полученное при помощи muscle на прошлом занятии gomol.msf . На картинке обведен фрагмент, по которому строился паттерн.
.
Первая - это последовательность исследуемого мною белка, остальные - его более менее дальние гомологи. Для этого выравнивания я написала 3 паттерна, приведенные в следующей таблице.

Таблица№1. Паттрены.
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности GLHTRPAAQFVKEAKGFTS 7 Кроме моей больше никакой
Сильный G-[LI]-[HQ]-[AT]-R-[PA]-[AT]-[ATS]-[QLVK]-[FL]-[VA]-[KQ]-[ET]-[AM]-[KNS]-[GRAK]-F-[TDSAQ]-[SA] 19 Все
Слабый G-[LI]-[HQ]-[AT]-R-[PA]-[AT]-[ATS]-X-[FL]-[VA]-[KQ]-[ET]-[AM]-{AGV}-X-F 33 Все
При составлении паттернов использовала следующие правила :
[LI] - в данной позиции разрешены только остатки в квадратных скобках;
Х - любой остаток (для нескольких подряд, например 2, ставится Х(2);
{AGV} - запрет на остатки в фигурных скобках.
Как видно из результатов поиска ( производился на сайте http://www.expasy.org/prosite/ ), наряду с сильным паттерном используется слабый для расширения числа последовательностей, соответсвующих ему. Ослабить паттерн можно несколькими способами:
- в позициях, в которых все 5 букв оказались разными, заменить 5 букв в квадратных скобках буквой X;
- сократить паттерн, убрав по 2-3 позиции с каждого из концов;
- вместо, например, [RKYW] написать {AG}
и др.
В моем случае я заменила тройку гидрофильных АК [KNS] на {AGV} т.к. они гидрофобные. Так же заменила [GRAK] и [QLVK] на Х, т.к. там в одном столбце стоят АК с различными физико-химическими свойствами, и убрала [SA] и [TDSAQ].
В результате поиска из всех найденных белков два заметно отличались по названию - CRH_BACHD и CRH_BACSU. Первый был задействован в выравнивании, а последовательность второго, очевидно идентична посл-ти CRN_BACHD (белки из организмов, относящихся к одному отряду, и выполняющие одну и ту же функцию), по крайней мере в фрагменте, по которому был написан паттерн. Эти белки, как и мой, относятся к семейству HPr-белков (phosphocarrier protein HPr), но отличаются активным центром, т.к. 15 АК является не His, как у моего белка, а Gln.

Все описанные в PROSITE мотивы в заданном белке PTHP_Ecoli

Поиск снова делала по сайту http://www.expasy.org/prosite/ . Убрав галочку в поле "Exclude patterns with a high probability of occurrence" включила в выдаваемые мотивы и неспецифичные (т.е. часто встречающиеся).
Таблица№2. Мотивы белка PTHP_ECOLI.
Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS51350 PTS_HPR_DOM профиль PTS HPR домена - MATRIX Специфична 5
PS00369 PTS_HPR_HIS Подпись гистидинового фосфорилирующего сайта PTS HPR домена G - [LIVM] - H - [STAV] - R - [PAS] - [GSTA] - [STAMVN] Паттерн Специфична 5
PS00589 PTS_HPR_SER Подпись серинового фосфорилирующего сайта PTS HPR домена [GSTADE] - [KREQSTIV] - x - {EPRK} - {VPGL} - x - [KRDN] - S - [LIVMF](2) - {EVPL} - [LIVM] - {EATN} - x - [LIVM] - [GADE] Паттерн Специфична 5
PS00005 PKC_PHOSPHO_SITE Фосфорилирующий сайт белковой киназы С. [ST] - x - [RK] Паттерн Неспецифична 5
PS00008 MYRISTYL Сайт N-миристоилирования G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} Паттерн Неспецифична 5



©, "ООО Шиндяпина 2008"