На главную страницу вторго семестра

Создание паттернов для поиска и распознавания аминокислотных последовательностей


Фрагмент выравнивания по которому строились паттерны. Взятые белки являются предшественниками различных "blue oxidase", это являлось критерием ортологичности.
                                                                                         
                                            *                 2 0                        
C U E O _ E C O L I   :   T T L H W H G L - E V P G E V D G G P - - - - Q G I I   :   2 2
C U E O _ Y E R P E   :   T T V H W H G L - E I P G E V D G G P - - - - Q A L I   :   2 2
C U E O _ S A L T Y   :   T T L H W H G L - E I P G I V D G G P - - - - Q G I I   :   2 2
C U E O _ S A L T I   :   T T L H W H G L - E I P G I V D G G P - - - - Q G I I   :   2 2
L A C 1 _ T H A C U   :   T S I H W H G L L Q H R N A D D D G P S F V T Q C P I   :   2 7
L A C 4 _ T H A C U   :   T T I H W H G L F Q A T T A D E D G P A F V T Q C P I   :   2 7
                                                                                         

Свойства паттернов
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности
TTLHWHGLEVPGEVDGGPQGII
2 найден только исходный
Сильный
T-[ST]-[VIL]-HWHGL-X(0,1)-[EQ]-[VIHA]-[PRT]-[GNT]-[EIA]-[VD]-[DE]-[GD]-GP-X(0,4)-Q-[GAC]-[ILP]-I
8 Кроме 6-ти необходимых еще нашлось 2 последовательности из близкородственных белков.
Слабый
[LIV]-HWHGL-X(0,1)-[EQ]-X(1)-{GALVIF}-X(3)-[DE]-X(1)-GP-X(0,4)-Q-X(1)-[ILP]
9 Нашелся еще один близкородственный белок

Все результаты давольно предсказуемы, найдены только схожие белки (предшественники лакказ), возможно если слабый паттерн еще больше ослабить то можно найти и еще что-нибудь. Неудобно то что нельзя поставить на выбор пропуск или определенный амминокислотный остаток.
©Павел, Мазин