Проверка умений 1. Определение вторичной структуры.
Задание 1. Сравнение DSSP, Stride и аннотации из PDB.
Для анализа выбрана структура белка оксидоредуктазы 1ST9. В ней представлен домен альфа-бета-альфа сэндвича, удобный для исследования и рассмотрения.

DSSP
Поиск google выдал онлайн ресурс с DSSP: http://www.biogem.org/cgi-bin/edssp.pl. Результат работы программы представлен здесь: dssp_1st9.txt
Визуализацию можно найти на сервере PDB (см. строку изображения с подписью DSSP).



Stride
Онлайн-сервис с Stride: http://webclu.bio.wzw.tum.de/cgi-bin/stride/stridecgi.py. Предлагает не только выдачу в формате txt, но и удобную интерактивную визуализацию. Результат представлен здесь: stride_1st9.txt
Визуализация:



Аннотация PDB
Ссылка на запись PDB: 1st9.pdb В аннотации PDB не приводится детальной информации: любой тип спирали обозначен как HELIX, кроме спирали аннотированы еще тяжи: SHEET.

Сравнение методов
Сведение результатов методов и аннотаций в одну таблицу помогает наглядно разобраться с происходящим:

  CHAIN:   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A
RESIDUE:  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69
   DSSP:           E   E                   E   E   E       T   T   S       E   E   E   G   G   G   G   T   T   S   E   E   E   E   E   E   E
 Stride:   C   C   E   E   C   C   C   C   E   E   E   T   T   T   T   C   E   E   E   G   G   G   G   T   T   T   E   E   E   E   E   E   E
    PDB:           E   E                   E   E   E                       E   E   E       H   H   H   H           E   E   E   E   E   E   E

   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A
  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 101 102 103 104
       T   T       H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   G   G   G   T   E   E   E   E   E   E   E   E   S    
   T   T   T   T   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   G   G   G   C   E   E   E   E   E   E   E   E   T   T
               H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H               E   E   E   E   E   E   E   E        

   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A
 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139
       H   H   H   H   H   H   H   H   H   H   T   T           S       E   E   E   E   T   T   S   H   H   H   H   H   T   T           S   S
   C   H   H   H   H   H   H   H   H   H   H   H   C   C   C   C   C   E   E   E   E   T   T   T   H   H   H   H   H   H   C   C   C   T   T
   H   H   H   H   H   H   H   H   H   H   H   H                       E   E   E   E           H   H   H   H   H   H   H                    

   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   A   B
 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173  39
       E   E   E   E   E       T   T   S   E   E   E   E   E   E   E   S               H   H   H   H   H   H   H   H   H   H   H            
   T   E   E   E   E   E   E   T   T   T   E   E   E   E   E   E   E   C   C   C   C   H   H   H   H   H   H   H   H   H   H   H   C   C   C
       E   E   E   E   E                   E   E   E   E   E   E   E               H   H   H   H   H   H   H   H   H   H   H   H   H        

   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B
  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72  73  74
   B                   E   E   E   E   T   T   S       E   E   E   G   G   G   G   T   T   S   E   E   E   E   E   E   E       T   T       H
   B   C   C   C   C   E   E   E   E   T   T   T   C   E   E   E   G   G   G   G   T   T   T   E   E   E   E   E   E   E   T   T   T   T   H
                       E   E   E   E                   E   E   E       H   H   H   H           E   E   E   E   E   E   E               H   H

   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B
  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95  96  97  98  99 100 101 102 103 104 105 106 107 108 109
   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   G   G   G   T   E   E   E   E   E   E   E   E   S           H   H   H   H
   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   G   G   G   C   E   E   E   E   E   E   E   E   T   T   C   H   H   H   H
   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H   H               E   E   E   E   E   E   E   E           H   H   H   H   H

   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B
 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144
   H   H   H   H   H   H   T   T           S       E   E   E   E   T   T   S   H   H   H   H   H   T   T           S   S       E   E   E   E
   H   H   H   H   H   H   H   C   C   C   C   C   E   E   E   E   T   T   T   H   H   H   H   H   H   C   C   C   T   T   T   E   E   E   E
   H   H   H   H   H   H   H                       E   E   E   E           H   H   H   H   H   H   H                           E   E   E   E

   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   B   
 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173
   E       T   T   S   B   E   E   E   E   E   E   S               H   H   H   H   H   H   H   H   H   H   H           
   E   E   T   T   T   E   E   E   E   E   E   E   C   C   C   C   H   H   H   H   H   H   H   H   H   H   H   C   C   
   E                       E   E   E   E   E   E               H   H   H   H   H   H   H   H   H   H   H   H   H    

Как видно, толкьо в выдаче Stride присутствует аннотация C - coil, там, где другие аннотации не говорят ничего (например, цепь A 37-38, 41-44, 42, 94-105, 117-121 и др.).
DSSP же предсказывает S - bend, в отличие от других (напр. цепь A 51, 120, 149, 157 и др.).
Из бросающихся в глаза противоречий можно отметить, что DSSP и Stride по-разному размечают T (turn, повороты). Например, цепь A 48-52, 70-73: DSSP предсказывает более короткий поворот; цепь A 94, 116-117: DSSP единственный предсказывает повороты.
Интересно, что в структуре присутствуют перекрученные спирали 3-10. В аннотации PDB они обозначены как просто HELIX, но и DSSP, и Stride указывают G (3-10 helix). Примеры: цепь A 56-59, 91-93.

Ну, и главные отличия методов - в границах определения спиралей и тяжей.
Как ни странно, но все аннотации практически одинаково определяют границы тяжей. Это говорит о том, что определение тяжей более устойчиво и однозначно. Можно увидеть только одно различие в аннотации тяжей в цепи A (141-146) и два - в цепи B (141-146, 150-156). Во всех случаях Stride предсказывает более протяженный лист, чем указано в других аннотациях.



Границы спиралей более близки в предсказаниях DSSP и Stride, чем результаты этих методов к аннотации в PDB. Яркий пример - цепь A, остатки 73-91. DSSP и Stride сходятся в предсказании, а аннотация PDB "продлевает" спирали на один остаток с обеих сторон. Интересно, что границы перекрученной спирали 3-10 не совпадают с границами аннотации HELIX из PDB (напр. цепь A 56-59). В позициях 91-93 цепи A оба метода находят "перекрученное" продолжение стандартной альфа-спирали.



Задание 2. SheeP
Проанализируем тяж 141-145 цепи A с помощью SheeP (http://mouse.belozersky.msu.ru/sheep).
Интересно, что этот тяж определяется SheeP с остатка 140 по 146. Т.е. SheeP включает в тяж пролин на конце, который отбрасывается DSSP и Stride.






Как видно из изображений, пролин 140 хорошо включается в тяж и лист, участвует в образовании хребта. Возможно, что по крайней мере в этом случае SheeP делает лучшее предсказание, чем DSSP и Stride.

Стоит заметить, что в таблице на рис. 11 остатки, находящиеся по разные стороны от листа, отмечены разными цветами. Если проследить за гидрофобностью остатков с одной стороны, можно сделать заключение о том, какая сторона тяжа обращена в сторону гидрофобного ядра.
Несмотря на нестрогую закономерность, на "желтой" стороне больше гидрофобных остатков, чем на "красной". Это говорит, например, о том, что хребет, отмеченный на рис. 12 обращен в сторону от гидрофобного ядра. А хребет, отмеченный на рис. 13 обращен в сторону к гидрофобному ядру. Это действительно так, как видно из изображений.