Создание паттернов по множественному выравниванию.
Поиск по паттернам в банке данных Swiss-Prot.


В программе JalView рассмотрим множественное выравнивание, полученное при изучении последовательностей белка GLOX_BACSU и его гомологов в первом задании предыдущего занятия.
Выберем фрагмент выравнивания длиной 13 аминокислотных остатков для дальнейшего исследования, стараясь, чтобы 1/3 - 1/2 колонок фрагмента были консервативны на 70 – 100%, и получим изображение выбранного фрагмента выравнивания с раскраской по по BLOSUM62:

Паттерн - фрагмент последовательности

Первый паттерн является фрагментом последовательности белка GLOX_BACSU: VVIGGGIIGSAIA

Провели поиск последовательностей в банке Swiss-Prot, включающих мотивы, соответствующие указанному паттерну, на сайте PROSITE. Как видно из картинки, я получила только одну последовательность.

Сильный паттерн

Построим сильный паттерн так, чтобы он распознавал все белки нашей выборки и только их:

[VLIC]-[VI]-[IVL]-G-[GAS]-G-[IVGF]-[IVHF]-G-[SL]-[ALMS]-[ITSA]-A

В результате, я получила 25 находок.

Слабый паттерн

Построим слабый паттерн, стремясь к тому, чтобы он находил всех близких родственников белка GLOX_BACSU. Для этого разнообразим список аминокислотных остатков, учитывая их физико-химические свойства, и получим следующее:

[VLICAG]-[VILA]-[IVLA]-G-[GAST]-G-[IVGFAL]-[IVHFAL]-G[SLTV]-[ALMSI]-[ITSAVL]-A

Таким образом, мы имеем 203 находоки

Посмотреть файл полность в формате pdf slabii_pattern.pdf

Характеристика паттерна Паттерн Число последовательностей банка Swiss-Prot, в которых найден мотив, удовлетворяющий паттерну Количество найденных последовательностей из выравнивания

 

Фрагмент последовательности

 

VVIGGGIIGSAIA 1 1

 

Сильный

 

[VLIC]-[VI]-[IVL]-G-[GAS]-G-[IVGF]-[IVHF]-G-[SL]-[ALMS]-[ITSA]-A 25 Все 7

 

Слабый

 

[VLICAG]-[VILA]-[IVLA]-G-[GAST]-G-[IVGFAL]-[IVHFAL]-G[SLTV]-[ALMSI]-[ITSAVL]-A 203 Все 7

Поиск и описание мотивов в белке GLOX_BACSU по данным БД Prosite

Таблица Все описанные в PROSITE мотивы в заданном белке GLOX_BACSU

 

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи Паттерн Специфичность подпись Число найденных в белке мотивов
PS00008
MYRISTYL
 N-myristoylation site Паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}[GistheN-myristoylationsite] Неспецифична
12
PS00005
PKC_PHOSPHO_SITE
Protein kinase C phosphorylation site Паттерн [ST]-x-[RK] Неспецифична
3
PS00007
TYR_PHOSPHO_SITE  
Tyrosine kinase phosphorylation site : Паттерн [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y Неспецифична
1
PS00006
CK2_PHOSPHO_SITE   
Casein kinase II phosphorylation site   Паттерн [ST]-x(2)-[DE][SorTisthephosphorylationsite] Неспецифична
3