Для работы с этим заданием я взял структуру 2XMD бутирилхолинэстеразы человека. В структуре файла PDB предусмотрена аннотация вторичной структуры. Вот как она выгляит в файле 2XMD.pdb:
HELIX 1 1 LEU A 38 ARG A 42 5 5 HELIX 2 2 PHE A 76 MET A 81 1 6 HELIX 3 3 LEU A 125 ASP A 129 5 5 HELIX 4 4 GLY A 130 ARG A 138 1 9 HELIX 5 5 VAL A 148 LEU A 154 1 7 HELIX 6 6 ASN A 165 ILE A 182 1 18 HELIX 7 7 ALA A 183 PHE A 185 5 3 HELIX 8 8 SER A 198 SER A 210 1 13 HELIX 9 9 PRO A 211 PHE A 217 5 7 HELIX 10 10 SER A 235 THR A 250 1 16 HELIX 11 11 ASN A 256 ARG A 265 1 10 HELIX 12 12 ASP A 268 ALA A 277 1 10 HELIX 13 13 MET A 302 LEU A 309 1 8 HELIX 14 14 GLY A 326 VAL A 331 1 6 HELIX 15 15 THR A 346 PHE A 358 1 13 HELIX 16 16 SER A 362 THR A 374 1 13 HELIX 17 17 GLU A 383 PHE A 398 1 16 HELIX 18 18 PHE A 398 GLU A 411 1 14 HELIX 19 19 PRO A 431 GLY A 435 5 5 HELIX 20 20 GLU A 441 PHE A 446 1 6 HELIX 21 21 GLY A 447 GLU A 451 5 5 HELIX 22 22 GLU A 451 GLN A 455 5 5 HELIX 23 23 THR A 457 GLY A 478 1 22 HELIX 24 24 ARG A 515 SER A 524 1 10 HELIX 25 25 PHE A 525 VAL A 529 5 5 SHEET 1 AA 3 ILE A 5 ALA A 7 0 SHEET 2 AA 3 LYS A 12 ARG A 14 -1 O VAL A 13 N ILE A 6 SHEET 3 AA 3 ILE A 55 ASN A 57 1 O TRP A 56 N ARG A 14 SHEET 1 AB11 MET A 16 VAL A 20 0 SHEET 2 AB11 GLY A 23 PRO A 32 -1 O GLY A 23 N VAL A 20 SHEET 3 AB11 TYR A 94 PRO A 100 -1 O LEU A 95 N ILE A 31 SHEET 4 AB11 ILE A 140 MET A 144 -1 O VAL A 141 N TRP A 98 SHEET 5 AB11 ALA A 107 ILE A 113 1 O THR A 108 N ILE A 140 SHEET 6 AB11 GLY A 187 GLU A 197 1 N ASN A 188 O ALA A 107 SHEET 7 AB11 ARG A 219 GLN A 223 1 O ARG A 219 N LEU A 194 SHEET 8 AB11 ILE A 317 ASN A 322 1 O LEU A 318 N LEU A 222 SHEET 9 AB11 ALA A 416 PHE A 421 1 O PHE A 417 N VAL A 319 SHEET 10 AB11 LYS A 499 LEU A 503 1 O LEU A 501 N TYR A 420 SHEET 11 AB11 ILE A 510 THR A 512 -1 O MET A 511 N TYR A 500 CISPEP 1 ALA A 101 PRO A 102 0 -0.13 CISPEP 2 ASP A 379 GLN A 380 0 -0.75
Эта аннотация не всегда совпадает с предсказанной программами. В этом можно быстро убедиться с помощью PyMol, т.к. в него встроена
программа DSSP, позволяющая в два клика action
> assign sec. struc.
построить отображение вторичной структуры согласно
алгоритму DSSP, а не аннотации в файле. На рис.1 показано исходное отображение вторичной структуры, на рис.2 — после применения данной операции.
Как видно из этих изображений, DSSP определяет вторичную структуру более строго, из-за чего некоторые элементы вторичной структуры стали короче или вообще пропали.
Затем для продолжения изучения вопроса определения вторичной структуры я воспользовался веб-сервисом STRIDE. С помощью него была построена карта вторичной структуры для белка 2XMD (см. рис.3). На этой карте альфа-спирали показаны красным, 3-10 спирали синим, бета-листы зеленым. Выдача STRIDE для 2XMD доступна по ссылке. Я сравнил некоторые элементы, предсказанные STRIDE, с соответствующими из аннотации в файле PDB. Результаты представлены в таблице 1.
Тип структуры | Начало в PDB | Начало в STRIDE | Конец в PDB | Конец в STRIDE | Комментарий |
---|---|---|---|---|---|
Альфа-спираль | 165N | 166M | 182I | 181N | За исключением двух концевых остатков аннотации совпадают |
3-10 спираль | 183A | 182I | 185F | 185F | В PDB не указывается тип спирали, однако факт, что в районе 182-183 остатка одна спираль сменяется другой, отражен. |
Цис-конформация | 101A | — | 102P | — | STRIDE не детектирует цис-конформации пептидной связи, а 101A отнес к бета-тяжу (см. след. ряд) |
Бета-тяж | 94Y | 94Y | 100P | 101A | Совпадение |
Бета-мост | — | 324D | — | 324D | В PDB нет аннотации бета-мостов. |
Короткие 3-10 спирали | — | — | — | — | STRIDE определяет 6 коротких 3-10 спиралей по 3 остатка. Эти участки аннотированы в PDB в составе более длинных спиралей, в среднем на 2.5 остатка длиннее. |
С помощью SheeP постройте карту одного из бета-листов в выбранной вами структуре белка и сопоставьте с изображением этого листа.
С помощью сервиса SheeP была построена карта бета-листов 2XMD. Всего было найдено 2 листа, я взял меньший ради удобства работы. Схема листа и изображение представлены на рис. 4 и рис. 5.
Все остатки, составляющие карту SheeP, покрашены на изображении в зеленый. В формате карт SheeP цветом показаны хребты бета-листа, т. е. остатки, обращенные в одну сторону. Для трех гребней I5-R14-N57, I6-V13-W56, A7-K12-I55 на изображение нанесены C-альфа атомы, покрашенные в цвет, соответствующий цвету на карте.
По цвету, в который SheeP покрасил хребты, можно определить, в какую сторону они смотрят — в сторону гидрофобного ядра или к поверхности. Для того, чтобы понять, какой цвет что значит, я посчитал число гидрофобных остатков каждого цвета. Для желтых хребтов гидрофобны 6 из 8 остатков (75%), для красных 3 из 6 (50%). Значит, желтый хребет обращен к гидрофобному ядру, подтверждение чему можно видеть на изображении.
С помощью консольной версии STRIDE на kodomo был получен список водородных связей для участка, соответствующего карте выше. Аннотация водородных связей с помощью консольного STRIDE совпала с аннотацией встроенными инструментами PyMol. Изображение рассматриваемого листа с нанесенными водородными связями приведено на рис. 6. Выдача STRIDE доступна по ссылке.
По результатам построения водородных связей можно сказать, что в этом бета-листе нет нерегулярностей.