Главная
Учебные материалы

Создание паттернов аминокислотных последовательностей

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности G-T-N-G-Q-R-I-P-Y-I-I-S-I-A-G-S-V-A-V 21 Только исходная COAA_ECOLI
Сильный X-[GNDQ]-[RNVST]-[NAVKDE]-[SENG]-[KGREHQP]-[SKNAR]-[QMVPI]-P-[FY]-[IV]-I-[GS]-[VI]-[SA]-G-S-V-[AS]-V 43 Найдены все последовательности
Слабый X(1,9)-P-[FY]-[IV]-I-[GS]-[VI]-[SA]-G-S-V-[AS]-V 147 Найдены все последовательности


Как видно из результатов поиска, ослабляя или усиливая паттерн, мы можем варьировать степень родства найденных белков, исследуя либо узкий класс белков или же более широкое семейство.

Все описанные в PROSITE мотивы в заданном белке COAA_Ecoli

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00001 ASN_GLYCOSYLATION Сайт N-гликозилирования (N-glycosylation site) паттерн N - {P} - [ST] - {P} неспецифична 1
PS00005 PKC_PHOSPHO_SITE Сайт фосорилирования белка-киназы С (Protein kinase C phosphorylation site) паттерн [ST] - x - [RK] неспецифична 2
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеин-киназы II (Casein kinase II phosphorylation site) паттерн [ST] - x(2) - [DE] неспецифична 7
PS00017 ATP_GTP_A Сайт связывания АТФ/ГТФ мотива А(P-цикличный) (ATP/GTP-binding site motif A (P-loop)) паттерн [AG] - x(4) - G - K - [ST] неспецифична 1

Создание PSSM:

Программа prophecy (пакета EMBOSS) создает матрицу (профиль) по заданному множественному выравниванию. В моем случае -part2.txt.
Программа может работать в 3 режимах: F- (Frequency) установлен по умолчанию ,G-(Gribskov) ,H-(Henikoff)

По умолчанию для расчетов:
- в режиме F, H поумолчанию используется -EBLOSUM62, для G -Epprofile
-штраф за открытие гэпа 3.0
-штраф за продление гэпа 0.3

Программа profit использует эту матрицу для определения веса последовательности.

Т.е prophecy строит матрицу в которой количество строк соответствует количеству позиций в выравнивании, а количество колонок 20 -соответственно количеству аминокислот. Такая простая матрица частот строиться исходя из того сколько раз аминокислота встречается в каждой позиции выравнивания. Такая матрица частот создается prophecy с опцией "F".При это выбранный участок выравнивания не должен содержать гэпы.

Далее программа profit используя эту матрицу вычисляет вес, для каждой последовательности из списка по которому проводиться поиск. Вес за совпадение вычисляется исходя из простой матрицы частот, как сумма в каждом положении матрицы.

©Залевский, Артур, 2007