Возврат на главную страницу второго семестра

Консервативные аминокислотные остатки в выборке 4 потенциальных ортологов белка CRP_ECOLI

Матрица попарного сходства выборки ортологов

            CRP_ECOLI  CRP_PASMU  CRP_HAEIN  VFR_PSEAE  CLP_XANCP 

 CRP_ECOLI        100%                                            

 CRP_PASMU         84%       100%                                 

 CRP_HAEIN         70%        74%       100%                      

 VFR_PSEAE         62%        58%        52%       100%           

 CLP_XANCP         40%        41%        42%        43%       100%
Слева приведена матрица попарного сходства последовательностей моей выборки. В данном задании рекомендовалось использовать большее количество последовательностей, но среди найденных не было достаточного числа предполагаемых ортологов. Один из изначально используемых имел процент сходства с остальными больший 90%, поэтому был удален из выборки.

Сходство в матрице измеряется в процентах точного совпадения последовательностей.

Множественное выравнивание выборки ортологов

                                                                                                                                                                                                           
                                *       1 0         *       2 0         *       3 0         *       4 0         *       5 0         *       6 0         *       7 0         *       8 0                    
C R P _ E C O L I   :   - - - - - - - - - - - - - - - M V L G K P Q T D P T L E W F L S H C H I H K Y P S K S T L I H Q G E K A E T L Y Y I V K G S V A V L I K D E E G K E M I L S Y L N Q G D   :     6 9
C R P _ P A S M U   :   - - - - - - - - - - - - - - - - M Q T T P S I D P T L E W F L S H C H I H K Y P S K S T L I H A G E K A E T L Y Y L I K G S V A V L V K D E D G K E M I L T Y L S Q G D   :     6 8
C R P _ H A E I N   :   - M S N E L T E I D E V V T S S Q E E A T Q R D P V L D W F L T H C H L H K Y P A K S T L I H A G E D A T T L Y Y V I K G S V M V S S K D D E G K E M I L T Y L G A G Q   :     8 3
V F R _ P S E A E   :   - - - - - - - - - - - - - - M V A I T H T P K L K H L D K L L A H C H R R R Y T A K S T I I Y A G D R C E T L F F I I K G S V T I L I E D D D G R E M I I G Y L N S G D   :     7 0
C L P _ X A N C P   :   M S L G N T T V V T T T V R N A T P S L T L D A G T I E R F L A H S H R R R Y P T R T D V F R P G D P A G T L Y Y V I S G S V S I I A E E D D D R E L V L G Y F G S G E   :     8 4
                                                                                                                                                                                                           
                                                                                                                                                                                                           
                        *       9 0         *     1 0 0         *     1 1 0         *     1 2 0         *     1 3 0         *     1 4 0         *     1 5 0         *     1 6 0         *     1            
C R P _ E C O L I   :   F I G E L G L F E E G - - - Q E R S A W V R A K T A C E V A E I S Y K K F R Q L I Q V - - - - - N P D I L M R L S A Q M A R R L Q V T S E K V G N L A F L D V T G R I A   :   1 4 5
C R P _ P A S M U   :   F F G E A G L F E E G - - - Q L R S A W I K A K S P C E I A E I S Y K K F R Q L I Q V - - - - - N P D I L M H L S A Q L A R R L Q N T S R Q V S N L A F L D V T G R I A   :   1 4 4
C R P _ H A E I N   :   F F G E A G L F D E G - - - S K R S A W V K T K T T C E I A E I S Y K K Y R Q L I Q A - - - - - N P E I L M F L T A Q L A R R L Q N T S R Q V T N L A F L D V A G R I A   :   1 5 9
V F R _ P S E A E   :   F F G E L G L F E K E G S E Q E R S A W V R A K V E C E V A E I S Y A K F R E L S Q Q - - - - - D S E I L Y T L G S Q M A D R L R K T T R K V G D L A F L D V T G R V A   :   1 4 9
C L P _ X A N C P   :   F V G E M G L F I E S - - - D T R E V I L R T R T Q C E L A E I S Y E R L Q Q L F Q T S L S P D A P R I L Y A I G V Q L S K R L L D T T R K A S R L A F L D V T D R I V   :   1 6 5
                                                                                                                                                                                                           
                                                                                                                                                                     
                        7 0         *     1 8 0         *     1 9 0         *     2 0 0         *     2 1 0         *     2 2 0         *     2 3 0                  
C R P _ E C O L I   :   Q T L L N L A K Q P D A M T H P D G M Q I K I T R Q E I G Q I V G C S R E T V G R I L K M L E D Q N L I S A H G K T I V V Y G T R   :   2 1 0
C R P _ P A S M U   :   Q T L L N L A K M P E A M T H P D G M Q I K I T R Q E I G Q M V G C S R E T V G R I L K M L E D Q H L I S A H G K T I V V Y G T R   :   2 0 9
C R P _ H A E I N   :   Q T L M N L A K Q P E A M T H P D G M Q I K I T R Q E I G Q M V G C S R E T V G R I I K M L E D Q N L I H A H G K T I V V Y G A R   :   2 2 4
V F R _ P S E A E   :   R T L L D L C Q Q P D A M T H P D G M Q I K I T R Q E I G R I V G C S R E M V G R V L K S L E E Q G L V H V K G K T M V V F G T R   :   2 1 4
C L P _ X A N C P   :   R T L H D L S K E P E A M S H P Q G T Q L R V S R Q E L A R L V G C S R E M A G R V L K K L Q A D G L L H A R G K T V V L Y G T R   :   2 3 0
                                                                                                                                                                     

Голубым цветом отмечены консервативные на 100% аминокислоты, а фиолетовым — консервативные на 80%. Множественное выравнивание построено с помощью программы emma из програмного пакета EMBOSS для UNIX.

3D-структура белка CRP_ECOLI с выделенными консервативными остатками зоны связывания лиганда

Последовательности, которые были использованы для построения множественного выравнивания, довольно консервативны в общем, а не только в зоне связывания лиганда. Поэтому, возможно, консервативность исследуемой зоны так высока. Но если брать среднее значение консервативности по последовательности, то консервативность зоны связывания будет больше (в ней 18 из 22 остатков в той или иной степени консервативны, а во всем выравнивании явно консервативна меньшая часть).

На рисунке справа изображена в большем масштабе зона контакта с одним из лигандов (CMP621).

Изображенная слева модель структуры белка, полученная с помощью программы RASMOL, демонстрирует выделенные в виде ball-and-stick атомы и остатки, находящиеся в радиусе 5 Å от двух одинаковых лигандов (CMP621 и CMP622), и сами лиганды. Зеленым цветом обозначены лиганды, красным — консервативные на 100% остатки, расположенные в зоне контакта (это GLU58, GLY71, GLU72, ARG82, ARG123, THR127, GLN170, GLY177, CYS178, SER179, ARG180), синим, соответственно, консервативные на 80% остатки (LYS57, MET59, LEU61, LEU64, SER83, ALA 84, GLY 173).

Данная картина, но в несколько ином представлении, генерируется скриптом, который можно прочитать здесь .

Из полученной картины следует, что зона контакта белка CRP_ECOLI c его лигандом CMP высоко консервативна. Это вполне логично, так как очень часто замены на неродственные аминокислоты в таких участках может привести к потере способности связывания с лигандом, что означало бы потерю функции белка. Сам алгоритм нахождения консервативных остатков путем поиска ортологов моего белка наводит на мысль, что функции белков, последовательности которые будут таким образом найдены и выровнены, должны быть одинаковы.


© Dibrova Dasha aka UdavDasha, 2005