Создание паттернов для поиска и распознавания аминокислотных последовательностей

 

На главную страницу второго семестра

 

По следующему фрагменту выравнивания построено 2 паттерна: сильный и слабый.

                                                                           
                                            *                              
F C T A _ O X A F O   :   D V M V E N F G P G A L D R M G F T W   :     1 9
F C T A _ E C O L I   :   D I L V E N F H P G A I D H M G F T W   :     1 9
F C T A _ S T R A W   :   D V M V E N F G P G A V D R M G F T W   :     1 9
F C T A _ S T R C O   :   D V M V E N F G P G A V D R M G F T W   :     1 9
F C T A _ B R A J A   :   D V L V E N F G P G V L D R M G F P W   :     1 9
F C T A _ R H O P A   :   D V L V E N F G P G V L D R M G F T W   :     1 9
                          D     V E N F   P G     D   M G F   W            

Как видим, участок консервативный.

Поиск по паттернам в SwissProt

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности D-I-L-V-E-N-F-H-P-G-A-I-D-H-M-G-F-T-W 4 Нет
Сильный D-[VI]-[ML]-VENF-[GH]-PG-[AV]-{FYWDERN}-D-[RH]-MGF-[TP]-W 9 Все
Слабый [ERND]-[DERN]-[FYW]-X(0,1)-[KGDEH]-[PG]-G-[AVLI]-{DERN}-{AG}-{AG} 136 Все
Чтобы вызвать резкое изменение количества находок, понадобилось сильное ослабление паттерна, причем при постепенном увеличении степеней свободы достаточно долго число находок оставалось равным 9, выдавались одни и те же очень близкие между собой бактериальные формил-КоА-трансферазы. Судя по одинаковой функции и сильному сходству последовательностей, это ортологи. Скачок в количестве находок появился при отбрасывании 4 первых остатков паттерна и разрешении в позиции 6 глутамина, аспарагиновой и глутаминовой кислоты в добавление к бывшему там аспарагину. Появившиеся при этом в находке белки уже не обязательно относятся к формил-КоА-трансферазам, да и вообще их гомология с FCTA_ECOLI кажется сомнительной. Можно сделать предположение, что выбранный участок последовательности не относится к активному центру домена CoA_transf_3, т.к. тогда бы на сильный паттерн откликались многочисленные белки, содержащие этот домен.
©Петрова Ирина