Паттерны и профили.

№1. Создание и проверка собственного паттерна

При выполнении предыдущего задания было получено множественное выравнивание белка ACP_BACSU и нескольких белков с различной степенью идентичности (от 90 до 50%).
Его фрагмент длиной 20 а.о. (картинка приведена ниже) используем для составления паттернов.


(окраска по консервативности выставлена на 70%, 10 а.о. не превысили данный порог консервативности)
Fig.1


Для ускорения работы выпишем информацию об использованных белках:

Таблица 1. Использованные гомологи

Организм ID AC
Bacillus subtilis ACP_BACSU P80643
Brevibacillus brevis ACP_BREBN C0ZFP2
Listeria welshimeri serovar 6b ACP_LISW6 A0AJR1
Haemophilus parasuis serovar 5 ACP_HAEPS B8F7C3
Vibrio parahaemolyticus ACP_VIBPA P0A2W2
Tolumonas auensis ACP_TOLAT C4L8E4
Pseudomonas putida ACP_PSEP1 A5W713
Geobacter metallireducens ACP_GEOMG Q39V90
Akkermansia muciniphila ACP_AKKM8 B2UQS2
Oceanobacillus iheyensis ACP_OCEIH Q8ER06


В ходе анализа выбранного выравнивания были получены 3 паттерна, проведен анализ распределения результатов поиска с помощью BLAST,
и создана следующая таблица:

Полученные паттерны

Характеристика паттерна Паттерн Число последовательностей в банке Swiss-Prot, удовлетворяющих паттерну Число найденных последовательностей из моего выравнивания (а также описание других найденных)
Фрагмент последовательности   EADVKLEASFKEDLGADSLD   2   Отыскался белок ACP_BACSU, как и предполагалось.* Позже, анализируя последовательности с помощью BLAST, я обнаружил, что обе бактерии имеют абсолютно идентичный белок (AC совпадает).
Сильный   [EAS]-[ASED]-[DKEQ]-[VI]-[KT]-[LPNSIAM]-[EAD]-[ATK]-[SK]-F-[KIVM]-[ED]-DL-[GD]-ADSLD   64, все это белки, выполняющие одинаковую функцию (ACP)   найдены все белки выравнивания (к этому стремились).**
Слабый   [EAS]-[ASED]-[DKEQ]-[VI]-[KT]-X-[EAD]-[ATK]-[SK]-F-[KIVM]-[ED]-[DE]-[LI]-[GD]-[AG]-[DE]   87, причем, приятно заметить, что все это тоже ACP.   Все белки множественного выравнивания нашлись и в этот раз.***


*

Также, к моему удивлению, этому паттерну отвечает также белок бактерии того же рода ACP_BACA2 (очень сходная последовательность, я перепробовал три совершенно разных участка выравнивания по 20 а.о., но результат поиска остался прежним. Позже, анализируя последовательности с помощью BLAST, я обнаружил, что обе бактерии имеют абсолютно идентичный белок (AC совпадает).

**

Это самый строгий паттерн, позволяющий найти все искомые белки, тем не менее нашлось весьма много "лишних" результатов. Тем обиднее, что это белки далеких таксономических групп.

Например, белок B7JC10 (ACP_ACIF2) железобактерии Acidithiobacillus ferrooxidans в соответствии с BLAST идентичен белку ACP_BACSU на 62% (114-ая позиция поиска), в то время как сами виды родственны лишь на уровне царства BACTERIA.

***

(Паттерн был укорочен на 3 а.о., использована 1 произвольная позиция (X), добавлены некоторые сходные остатки, например-[DE]-[LI]- вместо-DL-)



№2. Все описанные в PROSITE мотивы в белке ACP_BACSU

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн Специфична ли подпись? Сколько мотивов нашлось в белке?
PS50075 ACP_DOMAIN Acyl carrier protein phosphopantetheine domain profile профиль [DEQGSTALMKRH]-[LIVMFYSTAC]-[GNQ]-[LIVMFYAG]-[DNEKHS]-S-[LIVMST]-{PCFY}-[STAGCPQLIVMF]-[LIVMATN]-[DENQGTAKRHLM]-[LIVMWSTA]-[LIVGSTACR]-{LPIY}-{VY}-[LIVMFA] специфична 1
  PS00012  PHOSPHOPANTETHEINE   Phosphopantetheine attachment site   паттерн  [DEQGSTALMKRH]-[LIVMFYSTAC]-[GNQ]-[LIVMFYAG]-[DNEKHS]-S-[LIVMST]-{PCFY}-[STAGCPQLIVMF]-[LIVMATN]-[DENQGTAKRHLM]-[LIVMWSTA]-[LIVGSTACR]-{LPIY}-{VY}-[LIVMFA]  специфична  1
  PS00008  MYRISTYL  Сайт N-миристоилирования  паттерн   G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}[GistheN-myristoylationsite]  неспецифична  1
  PS00005  PKC_PHOSPHO_SITE  Protein kinase C phosphorylation site  паттерн   [ST]-x-[RK]  неспецифична  1
 PS00006  CK2_PHOSPHO_SITE  Casein kinase II phosphorylation site  паттерн  [ST]-x(2)-[DE][SorTisthephosphorylationsite]  неспецифична  3




назад в проекты


© Aleshin Vasily