Паттерны и банк PROSITE
Создание паттернов по множественному выравниванию.
Поиск по паттернам в банке данных Swiss-Prot.
В программе JalView рассмотрим множественное выравнивание, полученное при изучении последовательностей белка GLOX_BACSU и его гомологов в первом задании предыдущего занятия.
Выберем фрагмент выравнивания длиной 13 аминокислотных остатков для дальнейшего исследования, стараясь, чтобы 1/3 - 1/2 колонок фрагмента были консервативны на 70 – 100%, и получим изображение выбранного фрагмента выравнивания с раскраской по по BLOSUM62:
Первый паттерн является фрагментом последовательности белка GLOX_BACSU: VVIGGGIIGSAIA
Провели поиск последовательностей в банке Swiss-Prot, включающих мотивы, соответствующие указанному паттерну, на сайте PROSITE. Как видно из картинки, я получила только одну последовательность.
Построим сильный паттерн так, чтобы он распознавал все белки нашей выборки и только их:
[VLIC]-[VI]-[IVL]-G-[GAS]-G-[IVGF]-[IVHF]-G-[SL]-[ALMS]-[ITSA]-A
В результате, я получила 25 находок.
Построим слабый паттерн, стремясь к тому, чтобы он находил всех близких родственников белка GLOX_BACSU. Для этого разнообразим список аминокислотных остатков, учитывая их физико-химические свойства, и получим следующее:
[VLICAG]-[VILA]-[IVLA]-G-[GAST]-G-[IVGFAL]-[IVHFAL]-G[SLTV]-[ALMSI]-[ITSAVL]-A
Таким образом, мы имеем 203 находоки
Посмотреть файл полность в формате pdf slabii_pattern.pdf
Характеристика паттерна | Паттерн | Число последовательностей банка Swiss-Prot, в которых найден мотив, удовлетворяющий паттерну | Количество найденных последовательностей из выравнивания |
Фрагмент последовательности
|
VVIGGGIIGSAIA | 1 | 1 |
Сильный
|
[VLIC]-[VI]-[IVL]-G-[GAS]-G-[IVGF]-[IVHF]-G-[SL]-[ALMS]-[ITSA]-A | 25 | Все 7 |
Слабый
|
[VLICAG]-[VILA]-[IVLA]-G-[GAST]-G-[IVGFAL]-[IVHFAL]-G[SLTV]-[ALMSI]-[ITSAVL]-A | 203 | Все 7 |
Идентификатор документа Prosite (AC) | Название мотива | Краткое описание мотива | Тип подписи | Паттерн | Специфичность подпись | Число найденных в белке мотивов |
PS00008 |
MYRISTYL |
N-myristoylation site | Паттерн | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}[GistheN-myristoylationsite] | Неспецифична | 12 |
PS00005 |
PKC_PHOSPHO_SITE |
Protein kinase C phosphorylation site | Паттерн | [ST]-x-[RK] | Неспецифична | 3 |
PS00007 |
TYR_PHOSPHO_SITE |
Tyrosine kinase phosphorylation site : | Паттерн | [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y | Неспецифична | 1 |
PS00006 |
CK2_PHOSPHO_SITE |
Casein kinase II phosphorylation site | Паттерн | [ST]-x(2)-[DE][SorTisthephosphorylationsite] | Неспецифична | 3 |