Создание паттернов аминокислотных последовательностей
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot
найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности |
G-T-N-G-Q-R-I-P-Y-I-I-S-I-A-G-S-V-A-V |
21 |
Только исходная COAA_ECOLI |
Сильный |
X-[GNDQ]-[RNVST]-[NAVKDE]-[SENG]-[KGREHQP]-[SKNAR]-[QMVPI]-P-[FY]-[IV]-I-[GS]-[VI]-[SA]-G-S-V-[AS]-V |
43 |
Найдены все последовательности |
Слабый |
X(1,9)-P-[FY]-[IV]-I-[GS]-[VI]-[SA]-G-S-V-[AS]-V |
147 |
Найдены все последовательности |
Как видно из результатов поиска, ослабляя или усиливая паттерн, мы можем варьировать степень родства найденных белков, исследуя либо узкий класс белков или же более широкое семейство.
Все описанные в PROSITE мотивы в заданном белке COAA_Ecoli
Идентификатор документа PROSITE (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (регулярное выражение) |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
PS00001 |
ASN_GLYCOSYLATION |
Сайт N-гликозилирования (N-glycosylation site) |
паттерн |
N - {P} - [ST] - {P} |
неспецифична |
1 |
PS00005 |
PKC_PHOSPHO_SITE |
Сайт фосорилирования белка-киназы С (Protein kinase C phosphorylation site) |
паттерн |
[ST] - x - [RK] |
неспецифична |
2 |
PS00006 |
CK2_PHOSPHO_SITE |
Сайт фосфорилирования казеин-киназы II (Casein kinase II phosphorylation site) |
паттерн |
[ST] - x(2) - [DE] |
неспецифична |
7 |
PS00017 |
ATP_GTP_A |
Сайт связывания АТФ/ГТФ мотива А(P-цикличный) (ATP/GTP-binding site motif A (P-loop)) |
паттерн |
[AG] - x(4) - G - K - [ST] |
неспецифична |
1 |
Создание PSSM:
Программа prophecy (пакета EMBOSS) создает матрицу (профиль)
по заданному множественному выравниванию. В моем случае -part2.txt.
Программа может работать в 3 режимах: F- (Frequency) установлен по умолчанию
,G-(Gribskov) ,H-(Henikoff)
По умолчанию для расчетов:
- в режиме F, H поумолчанию используется -EBLOSUM62, для G -Epprofile
-штраф за открытие гэпа 3.0
-штраф за продление гэпа 0.3
Программа profit использует эту матрицу
для определения веса последовательности.
Т.е prophecy строит матрицу в которой количество строк соответствует
количеству позиций
в выравнивании, а количество колонок 20 -соответственно количеству аминокислот.
Такая простая матрица частот строиться исходя из того сколько раз
аминокислота встречается в каждой позиции выравнивания. Такая матрица частот
создается prophecy с опцией "F".При это выбранный участок выравнивания не
должен содержать гэпы.
Далее программа profit используя эту матрицу вычисляет вес, для каждой
последовательности из списка по которому проводиться поиск.
Вес за совпадение вычисляется исходя из простой матрицы частот, как сумма
в каждом положении матрицы.
|