1. Определение вторичной структуры

Для работы с этим заданием я взял структуру 2XMD бутирилхолинэстеразы человека. В структуре файла PDB предусмотрена аннотация вторичной структуры. Вот как она выгляит в файле 2XMD.pdb:

HELIX    1   1 LEU A   38  ARG A   42  5                                   5    
HELIX    2   2 PHE A   76  MET A   81  1                                   6    
HELIX    3   3 LEU A  125  ASP A  129  5                                   5    
HELIX    4   4 GLY A  130  ARG A  138  1                                   9    
HELIX    5   5 VAL A  148  LEU A  154  1                                   7    
HELIX    6   6 ASN A  165  ILE A  182  1                                  18    
HELIX    7   7 ALA A  183  PHE A  185  5                                   3    
HELIX    8   8 SER A  198  SER A  210  1                                  13    
HELIX    9   9 PRO A  211  PHE A  217  5                                   7    
HELIX   10  10 SER A  235  THR A  250  1                                  16    
HELIX   11  11 ASN A  256  ARG A  265  1                                  10    
HELIX   12  12 ASP A  268  ALA A  277  1                                  10    
HELIX   13  13 MET A  302  LEU A  309  1                                   8    
HELIX   14  14 GLY A  326  VAL A  331  1                                   6    
HELIX   15  15 THR A  346  PHE A  358  1                                  13    
HELIX   16  16 SER A  362  THR A  374  1                                  13    
HELIX   17  17 GLU A  383  PHE A  398  1                                  16    
HELIX   18  18 PHE A  398  GLU A  411  1                                  14    
HELIX   19  19 PRO A  431  GLY A  435  5                                   5    
HELIX   20  20 GLU A  441  PHE A  446  1                                   6    
HELIX   21  21 GLY A  447  GLU A  451  5                                   5    
HELIX   22  22 GLU A  451  GLN A  455  5                                   5    
HELIX   23  23 THR A  457  GLY A  478  1                                  22    
HELIX   24  24 ARG A  515  SER A  524  1                                  10    
HELIX   25  25 PHE A  525  VAL A  529  5                                   5    
SHEET    1  AA 3 ILE A   5  ALA A   7  0                                        
SHEET    2  AA 3 LYS A  12  ARG A  14 -1  O  VAL A  13   N  ILE A   6           
SHEET    3  AA 3 ILE A  55  ASN A  57  1  O  TRP A  56   N  ARG A  14           
SHEET    1  AB11 MET A  16  VAL A  20  0                                        
SHEET    2  AB11 GLY A  23  PRO A  32 -1  O  GLY A  23   N  VAL A  20           
SHEET    3  AB11 TYR A  94  PRO A 100 -1  O  LEU A  95   N  ILE A  31           
SHEET    4  AB11 ILE A 140  MET A 144 -1  O  VAL A 141   N  TRP A  98           
SHEET    5  AB11 ALA A 107  ILE A 113  1  O  THR A 108   N  ILE A 140           
SHEET    6  AB11 GLY A 187  GLU A 197  1  N  ASN A 188   O  ALA A 107           
SHEET    7  AB11 ARG A 219  GLN A 223  1  O  ARG A 219   N  LEU A 194           
SHEET    8  AB11 ILE A 317  ASN A 322  1  O  LEU A 318   N  LEU A 222           
SHEET    9  AB11 ALA A 416  PHE A 421  1  O  PHE A 417   N  VAL A 319           
SHEET   10  AB11 LYS A 499  LEU A 503  1  O  LEU A 501   N  TYR A 420           
SHEET   11  AB11 ILE A 510  THR A 512 -1  O  MET A 511   N  TYR A 500           
CISPEP   1 ALA A  101    PRO A  102          0        -0.13                     
CISPEP   2 ASP A  379    GLN A  380          0        -0.75

Эта аннотация не всегда совпадает с предсказанной программами. В этом можно быстро убедиться с помощью PyMol, т.к. в него встроена программа DSSP, позволяющая в два клика action > assign sec. struc. построить отображение вторичной структуры согласно алгоритму DSSP, а не аннотации в файле. На рис.1 показано исходное отображение вторичной структуры, на рис.2 — после применения данной операции.

Рис.1 Вторичная структура 2XMD согласно аннотации

Рис.2 Вторичная структура 2XMD согласно DSSP

Как видно из этих изображений, DSSP определяет вторичную структуру более строго, из-за чего некоторые элементы вторичной структуры стали короче или вообще пропали.

Затем для продолжения изучения вопроса определения вторичной структуры я воспользовался веб-сервисом STRIDE. С помощью него была построена карта вторичной структуры для белка 2XMD (см. рис.3). На этой карте альфа-спирали показаны красным, 3-10 спирали синим, бета-листы зеленым. Выдача STRIDE для 2XMD доступна по ссылке. Я сравнил некоторые элементы, предсказанные STRIDE, с соответствующими из аннотации в файле PDB. Результаты представлены в таблице 1.

Рис.3 Карта вторичной структуры для XMD по результатам STRIDE

Таблица 1 Сравнение некоторых элементов вторичной структуры по аннотации PDB и согласно STRIDE

Тип структуры Начало в PDB Начало в STRIDE Конец в PDB Конец в STRIDE Комментарий
Альфа-спираль 165N 166M 182I 181N За исключением двух концевых остатков аннотации совпадают
3-10 спираль 183A 182I 185F 185F В PDB не указывается тип спирали, однако факт, что в районе 182-183 остатка одна спираль сменяется другой, отражен.
Цис-конформация 101A 102P STRIDE не детектирует цис-конформации пептидной связи, а 101A отнес к бета-тяжу (см. след. ряд)
Бета-тяж 94Y 94Y 100P 101A Совпадение
Бета-мост 324D 324D В PDB нет аннотации бета-мостов.
Короткие 3-10 спирали STRIDE определяет 6 коротких 3-10 спиралей по 3 остатка. Эти участки аннотированы в PDB в составе более длинных спиралей, в среднем на 2.5 остатка длиннее.

2. Сопоставление выдачи SheeP с белком

С помощью SheeP постройте карту одного из бета-листов в выбранной вами структуре белка и сопоставьте с изображением этого листа.

С помощью сервиса SheeP была построена карта бета-листов 2XMD. Всего было найдено 2 листа, я взял меньший ради удобства работы. Схема листа и изображение представлены на рис. 4 и рис. 5.

Все остатки, составляющие карту SheeP, покрашены на изображении в зеленый. В формате карт SheeP цветом показаны хребты бета-листа, т. е. остатки, обращенные в одну сторону. Для трех гребней I5-R14-N57, I6-V13-W56, A7-K12-I55 на изображение нанесены C-альфа атомы, покрашенные в цвет, соответствующий цвету на карте.

По цвету, в который SheeP покрасил хребты, можно определить, в какую сторону они смотрят — в сторону гидрофобного ядра или к поверхности. Для того, чтобы понять, какой цвет что значит, я посчитал число гидрофобных остатков каждого цвета. Для желтых хребтов гидрофобны 6 из 8 остатков (75%), для красных 3 из 6 (50%). Значит, желтый хребет обращен к гидрофобному ядру, подтверждение чему можно видеть на изображении.

Рис.4 Карта бета-листа

Рис.5 Структура бета-листа

С помощью консольной версии STRIDE на kodomo был получен список водородных связей для участка, соответствующего карте выше. Аннотация водородных связей с помощью консольного STRIDE совпала с аннотацией встроенными инструментами PyMol. Изображение рассматриваемого листа с нанесенными водородными связями приведено на рис. 6. Выдача STRIDE доступна по ссылке.

По результатам построения водородных связей можно сказать, что в этом бета-листе нет нерегулярностей.

Рис.6 Водородные связи в бета-листе