Создание паттернов для поиска и распознавания аминокислотных последовательностей

   В банке Swiss-Prot были найдены и отобраны 5 наиболее вероятных ортологов белка GLK_ECOLI (признаком ортологичности считалось совпадение названий белков из рызных организмов). Затем посредством программы muscle было построено множественное выравнивание белка GLK_ECOLI и его найденных ортологов.

   Консервативный фрагмент выравнивания:

                                                                 
                                          *                      
G L K _ X A N A C   :   L V A D I G G T N A R F A L A   :     1 5
G L K _ X A N C P   :   L V A D I G G T N A R F A L A   :     1 5
G L K _ E R W C T   :   L V G D V G G T N T R L A L C   :     1 5
G L K _ N E I M B   :   L V A D I G G T N A R F A L E   :     1 5
G L K _ R A L S O   :   L V G D V G G T N A R F A L E   :     1 5
                        L V   D   G G T N   R   A L              
.

   Результаты поиска последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов:

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
 Фрагмент последовательности  LVGDVGGTNARLALC  8  Была найдена последовательность белка GLK_ECOLI и некоторых его ортологи. Из выравнивания последовательностей не было обнаружено.
 Сильный  LV - [AG] - D - [IV] - GGTN - [AT] - R - [LF] - AL - [ACE] - X(0,4) - [AMST] - [AMV] - [PT]  6  Были найдены все последовательности выравнивания (всего 5) и ещё одна последовательность (белка GLK_NEIMA), видимо, очень сильно схожая с последовательностью одного белка из выравнивания (белка GLK_NEIMB).
 Слабый  LV - [AG] - D - [IV] - GGTN - [AT] - {AGL} - [LF] - AL - [ACE]  17  Были найдены все последовательности из выравнивания, а также ещё 12 последовательностей.
.
На главную страницу второго семестра


©Дмитрий