Второй семестр

Создание паттернов для поиска и распознавания аминокислотных последовательностей

Выбранные последовательности в формате FASTA

Консервативный участок выравнивания, по которому строились паттерны.

                                                                           
                                            *                              
G L M U _ B U C B P   :   N Y N G K K K L D T I I G D N V F I G   :     1 9
G L M U _ B U C A P   :   N Y D G V N K F K T I I G D N V L I G   :     1 9
G L M U _ B U C A I   :   N Y D G A N K F K T I I G D N V L V G   :     1 9
G L M U _ N E I G O   :   N Y D G V H K H K T V I G D E V R I G   :     1 9
G L M U _ E C O L I   :   N Y D G A N K F K T I I G D D V F V G   :     1 9
G L M U _ H A E I N   :   N Y D G A N K F K T I I G D D V F V G   :     1 9
                          N Y   G     K     T   I G D   V     G            

Результаты поиска последовательностей банка SwissProt по паттернам, созданным по участку (19 ао) последовательности GLMU_ECOLI.

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности NYDGANKFKTIIGDDVFVG 12 нет
Сильный NY-[ND]-G-[KVA]-[KNH]-K-[LFH]-[DK]-T-[IV]-IGD-[NED]-V-[FLR]-[IV]-G 28 да
Слабый NY-X-{FW}-X(2)-K-X(2)-T-X-IG-{NQ}-X-V-X(2)-G 55 да

Комментарии к таблице.

  1. Первый паттерн представляет собой фрагмент последовательности GLMU_ECOLI. Были найдены мой белок (GLMU_ECOLI), а так же два белка (GLMU_ECOL6; GLMU_ECO57) штаммов ЕCOLI. Была найдена одна последовательность из выравнивания (GLMU_HAEIN + штамм GLMU_HAEIN).
  2. Второй паттерн представляет из себя последовательность, которая учитывает все аминокислоты, входящие в участки предполагаемых ортологов и белка GLMU_ECOLI. программа нашла все последовательности выравнивания.
  3. Третий паттерн очень слабый. Найдены все мои последовательности + 50 новых.


    ©Nechay Olesya 2005