Главная
I Семестр
II Семестр
Проекты
Обратная Связь
|
Мотивы, паттерны и профили
Создание паттернов аминокислотных последовательностей
Возьмем паттерн по выравниванию программы muscle: выравнивание белка RSUA_ECOLI с гомологами
Я взял фрагмент выравнивания 215-230 (соответсвует 175-190 а.о белка RSUA_ECOLI):
Было создано три паттерна, отвечающие фрагменту выравнивания. Первый паттерн представляет собой в точности фрагмент последовательности белка
RSUA_ECOLI. Второй ("сильный") паттерн должен распознать все последовательности фрагмента выравнивания. Третий ("слабый") паттерн отвечает
более мягким требованиям к последовательностям.
Таблица результатов поиска по паттернам в базе данных SwissProt
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot
найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности |
R-L-T-I-S-E-G-R-Y-H-Q-V-K-R-M-F |
7 (файл с результатом) |
Нет, из выравнивания найдена только последовательность моего белка |
Сильный |
[ERLKN]-[VILA]-[VTQI]-[LI]-[FVTHS]-[EQ]- G-[KLR]-[NKHY]-[RH]-[EQIV]-[IV]-[RK]-R-[IML]-[FCTAL] |
31 (файл с результатом) |
Найдены все последовательности из выравнивания |
Слабый |
X-{YWRKHCMDE}-[VTQINL]-[LIV]-X-[EQDN]- G-[KLRIV]-{AG}-[RHK]-[EQIVDNL]-[IVL]-[RKH]-R-[IMLV]-X |
62 (файл с результатом) |
Найдены все последовательности из выравнивания |
По первому, самому строгому, паттерну (представляющему собой фрагмент последовательности белка RSUA_ECOLI) с помощью PROSITE в базе данных SwissProt
было найдено 7 последовательности, 3 из которых - это исходный белок RSUA_ECOLI (просто найденный в разных штаммах бактерии Escherichia coli).
Среди оставшихся 4 последовательностей, белки из того же семейства бактерий, что и E.Coli - Enterobacteriaceae.
В каждую позицию сильного паттерна были поставлены соответсвующие аминокислоты белков выравнивания, поэтому все белки выравнивания
были найдены в результате поиске по нему. Помимо этих белков, были найдены белки выполняющие те же функции в организмах различных
гамма-протеобактерий.
Ну и самый мягкий паттерн выдал, разумеется, самое большое количество белков (62 последовательностей).
Причем, были найдены белки (A5G913 и
A1AV03), которые выполняют совершенно другие
функции, что говорит о том, что такой "слабый" паттерн нельзя применять для поиска мотива в возможных гомологах белков.
Все описанные в PROSITE мотивы в заданном белке RSUA_ECOLI
Идентификатор документа PROSITE (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (регулярное выражение) |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
Координаты мотива в белке |
PS50889 |
S4 |
S4-РНК связывающий домен (S4 RNA-binding domain profile) |
Профиль |
Страница с матрицей |
Специфична |
1 |
1-68 |
PS01149 |
PSI_RSU |
Rsu семейство псевдоуридин синтетаз (Rsu family of pseudouridine synthase signature) |
Паттерн |
G-R-L-D-x(2)- [STA]-x-G-[LIVFA]- [LIVMF](3)-[ST]- [DNST] |
Специфична |
1 |
99-113 |
PS00008 |
MYRISTYL |
Сайт N-миристоилирования (N-myristoylation site) |
Паттерн |
G-{EDRKHPFYW}- x(2)-[STAGCN]-{P} |
Неспецифична |
3 |
12 - 17 24 - 29 51 - 56 |
PS00006 |
CK2_PHOSPHO_SITE |
Cайт фосфорилирования казеинкиназой II (Casein kinase II phosphorylation site) |
Паттерн |
[ST]-x(2)-[DE] |
Неспецифична |
3 |
74 - 77 177 - 180 223 - 226 |
PS00005 |
PKC_PHOSPHO_SITE |
сайт фосфорилирования протеинкиназой C (Protein kinase C phosphorylation site) |
Паттерн |
[ST]-x-[RK] |
Неспецифична |
2 |
118 - 120 123 - 125 |
PS00007 |
TYR_PHOSPHO_SITE |
Cайт фосфорилирования тирозинкиназой (Tyrosine kinase phosphorylation site ) |
Паттерн |
[RK]-x(2)-[DE]-x(3)- Y or [RK]- x(3)-[DE]-x(2)-Y |
Неспецифична |
1 |
125 - 132 |
|