Практикум 7. Поверхности и карманы

Задание 1


В этом задании предлагается сравнить две конформации белка: открытую и закрытую. Помимо визуального сравнения нужно также охарактеризовать конформации численно, посчитав SASA и MSA, сделать вывод.

Будем сравнивать структуры 4BP8 (открытая форма) и 4BP9 (закрытая форма). 4BP8 Содержит две молекулы белка в асимметричной единице, 4BP9 — шесть. Исходя из состава biological assembly (биологической единицы) для структур, понимаем, что фунциональная форма белка — мономер. Следовательно, для сравнения нужно выбрать по одной биологической единице от каждой структуры. Возьмем самую первую биологическую единицу в каждом случае.
Чтобы скачать биологическую единицу в pymol-е, нужно сказать: fetch XXXX, type=pdbN, где "XXXX" — PDBID, а "N" — номер биологической единицы.

two_forms_overview.png

4BP8 (открытая форма), зеленая слева и 4BP9 (закрытая форма), красная справа.
Белок состоит из преимущественно альфа-спиральной половинки (левая) и преимущественно бета-листовой половины (правая). При переходе от открытой к закрытой форме расстояние между ними уменьшается. Стало быть, сайт связывания расположен между двумя половинками.
Просто разглядывая структуры и по-разному их накладывая, можно вообразить себе три варианта, как открытая форма может переходить в закрытую:

mech.png

Воображаемые переходы открытой формы в закрытую. Слева направо: большое движение бета-листовой половинки, небольшие движения обеих половинок белка, большое движение альфа-спиральной половинки.
Как меня поправили преподаватели, левый и правый варианты являются нарушением третьего закона Ньютона. Все колебания белка как единого целого должны затрагивать все атомы белка. А раз так, то, рассматривая силу, приложенную к одной половине белка, мы должны рассматривать и противоположную силу, приложенную ко второй половине белка. Следовательно, половинки должны двигаться синхронно (средняя картинка).

alignment.png

Наложение структур super-ом. Вторичная структура предсказана паймолом, петли скрыты для наглядности. При наложении по всем атомам "двигаются" как левая, так и правая половинки белка.

Быстро узнать, как может выглядеть переход в закрытую форму, можно с помощью веб-сервера WebNMA. Сервер позволяет визуализировать первые пять низкочастотных колебательных мод белка, которые он находит, исходя из предположения, что белок — это сеть соединенных пружинками С-альфа атомов, с массами соответствующих остатков.

Привожу ссылку на выдачу веб-сервера для моих структур. Результаты будут храниться на сервере в течение 2 недель (начиная с 20.12.20), что, наверное, достаточно.

open_form_settings.png

Необходимые параметры, которые нужно установить для просмотра колебаний той моды открытой формы, которая, по-моему мнению, преимущественно участвует в переходе между открытой и закрытой формой.
Преподаватели предостерегли от того, чтобы воспринимать амплитуду этих колебаний буквально. Сервер мог ее для наглядности увеличить.

closed_form_settings.png

Настройки для просмотра той же моды в закрытой форме. Интересно то, что в закрытой конформации никакого открытия-закрытия сервер уже не предсказывает. Наверное, на то она и закрытая конформация.

Рассмотрим теперь изменения площади различных поверхности белка. Для 4bp9 предварительно был удален лиганд, и площадь поверхности считалась без него.

Поверхность Площадь в открытой форме, $Å^2$ Площадь в закрытой форме, $Å^2$
Молекулярная поверхность (MS) 86447.312 75390.453
Поверхность, доступная растворителю (SAS) 48201.973 32668.283

Тот факт, что SASA < MSA поначалу ставит в тупик, однако так, наверное, и должно быть для объекта со сложной неровной и вогнутой поверхностью, а также с большой полостью внутри.
Для "выпуклой" же молекулы без полостей ожидается, что SASА > MSA. Проверим это на примере молекулы бензола (создана в builder). Для нее MS составила 104.428$Å^2$, SAS — 244.595$Å^2$.

Возможно, для каких-то ферментов переход в закрытую конформацию действительно связан с необходимостью вытеснять какие-то молекулы воды из активного центра. В таком случае естественно ожидать уменьшение SASA при переходе от открытой к закрытой форме.
В случае же моего фермента переход между конформациями явно нужен не для вытеснения воды хотя бы потому, что даже в закрытой конформации сохраняется туннель в активный центр достаточной ширины для прохождения молекул воды:

hole.png

Туннель в молекулярной поверхности. Наличие туннеля в MS не означает, что туда может пройти вода, но в данном случае в SAS тоже есть туннель, просто он менее наглядный.

Зачем же тогда переход между открытой из закрытой формой?
Здесь уже нужно обратиться к биологии и статье, в которой эти структуры были получены. Название белка, который мы рассматриваем, — олигопептидаза В. Это протеаза, которая расщепляет маленькие (согласно авторам статьи, до 30 аминокислотных остатков) пептиды. Раз субстрат довольно большой, то и сайт связывания субстрата тоже должен быть большим.
Но как фермент умеет отличать большие белки от маленьких? Согласно статье, в открытой форме в ферменте нарушена каталитическая триада, а в закрытой она восстанавливается. Это можно трактовать наоборот с более биологической позиции: активен лишь тот фермент, который смог закрыться. Таким образом, если фермент попробует связать большой белок, то он просто не сможет закрыться и, следовательно, расщепить этот белок.

Получается, что уменьшение площади MS и SAS при переходе к закрытой форме является просто следствием компактизации белка, но напрямую на каталитическую функцию наличие или присутствие воды вряд ли влияет, так как переход в закрытую форму несет в себе функцию регуляции субстратной специфичности, а вода может пройти в сайт связывания и в закрытой форме.

Задание 2


В задании 2 нужно воспользоваться веб-сервером fpocket, чтобы понять, как переход в закрытую конформацию влияет на объем основного кармана связывания.

Поскольку мой фермент является олигопептидазой, субстрат у него не малая молекула, на которые рассчитан fpocket, а пептид, то есть что-то побольше. Не удивительно, поэтому, что fpocket не идеально сработал. Все-таки, он ищет углубления в поверхности белка, а тут целая здоровая полость с кучей углублений.

size_comparison.png

Сравнение размеров пептида из 30 аминокислот (вроде как максимальный размер, который помещается в полость белка) и молекулы бензола. Пептид был вырезан из структуры открытой формы (остатки 112-141).

open_form_fpocket.png

Результат fpocket для открытой формы. Центр полости достаточно далек от стенок, поэтому там совсем нет альфа-сфер.

closed_form_fpocket.png

Результат fpocket для закрытой формы. Из-за закрытия половинок расстояние между соседними поверхностями уменьшилось и полость заполняется лучше. Но все равно не целиком.

Визуально, кажется, что объем полости уменьшается. Закономерно, белок окружает расщепляемый пептид со всех сторон и, возможно, формирует какие-то контакты с ним, что ограничивает конформационную свободу пептида и, возможно, способствует прохождению реакции, если контакты фиксируют пептид в реакционноспособной конформации.

Задание 3


В этом задании необходимо было найти остатки, которые сильнее всего изменили свою экспонированность при переходе от открытой формы к закрытой.

Для расчета SAS остатков использовался dssp на kodomo.
В задании просят порассуждать, когда лучше оперировать SAS, а когда экспонированностью (отношением наблюдаемой SAS к теоретически возможной), а также предложить, как лучше характеризовать изменения этих параметров между двумя структурами: разностью или отношением.
Я считаю, что SAS нам важен для наших попыток считать неполярные члены энергии сольватации. Поскольку для разных остатков возможные SAS лежат в разных диапазонах значений, для анализа человеком удобно использовать экспонированность: мне мало скажет, что у какого-то остатка SAS составляет X $Å^2$, а вот то, что она половина от теоретической уже понятнее.
Примерно те же рассуждения про разность или отношение. Для расчета изменения энергий нас интересует разность SAS. Человеку же проще оперировать тем, во сколько раз изменилась экспонированность (или SAS, потому что отношение экспонированностей для одного и того же остатка это все равно что отношение SAS).
Однако, при работе с относительными изменениями возникает 2 проблемы:

  • Деление на нуль или на маленькую величину, что приводит или к ошибке или к очень большому значению изменения;
  • Наоборот, если у нас в числителе окажется 0, а в знаменателе не 0, то такому переходу 0 -> X будет соответствовать просто 0, что не очень информативно.


Эти проблемы можно решить, рассматривая не отношение SAS/экспонированностей, а разность экспонированностей. Разность экспонированностей покажет долю изменения SAS по сравниению с максимальной SAS для этого остатка.

In [44]:
import prody as prd

open_form = prd.parsePDB(r'4bp8.pdb')
open_form = prd.parseDSSP(r'4bp8_dssp.out', open_form)
open_form_sol_acc = open_form.getData('dssp_acc')

closed_form = prd.parsePDB(r'4bp9_A.pdb')
closed_form = prd.parseDSSP(r'4bp9_dssp.out', closed_form)
closed_form_sol_acc = closed_form.getData('dssp_acc')
@> 6048 atoms and 1 coordinate set(s) were parsed in 0.18s.
@> 5743 atoms and 1 coordinate set(s) were parsed in 0.08s.
In [45]:
open_form_res_acc = []
acc_pos = 0
for res in open_form.iterResidues():
    if "CA" in res.getNames():  # skip water
        step = len(res.getNames())
        open_form_res_acc.append([res, open_form_sol_acc[acc_pos]])
        acc_pos += step
In [46]:
closed_form_res_acc = []
acc_pos = 0
for res in closed_form.iterResidues():
    if "CA" in res.getNames():  # skip water
        step = len(res.getNames())
        closed_form_res_acc.append([res, closed_form_sol_acc[acc_pos]])
        acc_pos += step
In [49]:
open_form_res_acc[0:5]
Out[49]:
[[<Residue: THR 3 from Chain A from 4bp8 (7 atoms)>, 180.0],
 [<Residue: GLU 4 from Chain A from 4bp8 (9 atoms)>, 142.0],
 [<Residue: ARG 5 from Chain A from 4bp8 (11 atoms)>, 167.0],
 [<Residue: GLY 6 from Chain A from 4bp8 (4 atoms)>, 10.0],
 [<Residue: PRO 7 from Chain A from 4bp8 (7 atoms)>, 16.0]]
In [50]:
closed_form_res_acc[0:5]
Out[50]:
[[<Residue: ARG 5 from Chain A from 4bp9_A (11 atoms)>, 222.0],
 [<Residue: GLY 6 from Chain A from 4bp9_A (4 atoms)>, 17.0],
 [<Residue: PRO 7 from Chain A from 4bp9_A (7 atoms)>, 21.0],
 [<Residue: ILE 8 from Chain A from 4bp9_A (8 atoms)>, 59.0],
 [<Residue: ALA 9 from Chain A from 4bp9_A (5 atoms)>, 5.0]]

В открытой форме нумерация та же, что и в закрытой, но на два остатка больше с N-конца расшифровано.
Значения максимальной площади поверхности возьмем из Tien M. Z. et al. Maximum allowed solvent accessibilites of residues in proteins //PloS one. – 2013. – Т. 8. – №. 11. – С. e80635.
Нормировать будет на колонку Theoretical из таблицы 1 вышеупомянутой статьи.

In [70]:
max_sasa = {
"ALA" : 129.0,
"ARG" : 274.0,
"ASN" : 195.0,
"ASP" : 193.0,
"CYS" : 167.0,
"GLU" : 223.0,
"GLN" : 225.0,
"GLY" : 104.0,
"HIS" : 224.0,
"ILE" : 197.0,
"LEU" : 201.0,
"LYS" : 236.0,
"MET" : 224.0,
"PHE" : 240.0,
"PRO" : 159.0,
"SER" : 155.0,
"THR" : 172.0,
"TRP" : 285.0,
"TYR" : 263.0,
"VAL" : 174.0
}
In [82]:
open_minus_closed = []
for op_res, cl_res in zip(open_form_res_acc[2:], closed_form_res_acc):
    if op_res[0].getResname() == "MSE":  # if encounter Selenomethionine substitute Met SAS
        open_minus_closed.append((op_res[1] - cl_res[1]) / max_sasa["MET"])
        continue
    open_minus_closed.append((op_res[1] - cl_res[1]) / max_sasa[op_res[0].getResname()])
In [65]:
import seaborn as sns
In [69]:
sns.distplot(open_minus_closed)
Out[69]:
<matplotlib.axes._subplots.AxesSubplot at 0x23522182430>

Как мы видим, большинство остатков или не меняют свою экспонированность, или меняют ее незначительно (большой пик возле нуля). Вероятно, эти остатки относятся к гидрофобным ядрам.
В то же время, при переходе к закрытой конформации мы видим, что среди остатков, которые значительно изменяют экспонированность, больше тех, которые в закрытой форме стали менее экспонированы. Это можно понять, рассмотрев хвосты распределения. Правый хвост, соответствующий остаткам, у которых $SAS_{open} > SAS_{closed}$ более длинный (остатки сильнее "упаковываются", чем "распаковываются") и более "толстый" (таких остатков больше, чем тех, для кого поведение противоположное), чем левый хвост.
Эти наблюдения согласовываются с интуитивным представлением о закрытой форме как о более компактной.

Рассмотрим остатки, который сильнее всего "упаковываются" или "распаковываются".

In [81]:
res_plus_delta_RSAS = list(zip(range(5, 715), open_minus_closed))
res_plus_delta_RSAS.sort(key = lambda x: x[1])

print(f"Maximum RSA increase upon closure: {res_plus_delta_RSAS[0]}")
print(f"Maximum RSA decrease upon closure: {res_plus_delta_RSAS[-1]}")
Maximum RSA increase upon closure: (385, -0.3081761006289308)
Maximum RSA decrease upon closure: (683, 0.6116071428571429)

В соответствии с выводом, озвученным выше, экспонированность меняется сильнее (в 2 раза) в случае "упаковки" остатка 683, чем в случае "распаковки" остатка 385.

Поговорим сначала про остаток, который сильнее всего запаковывается при закрытии структуры: HIS 683.

his_683_open.png

His 683 (желтый) и его непосредственное (5 ангстрем) окружение (белое) в открытой форме белка.
Остаток расположен в петле, выходящей на поверхности белка и потому сильно экспонирован в открытой форме.

his_683_closed.png

His 683 (желтый) и его непосредственное (5 ангстрем) окружение (белое) в закрытой форме белка.
При переходе в закрытую форму петля, в которой находился His 683, полностью погрузилась внутрь белка, участвуя в закрытии сайта связывания пептида. Наблюдаем также увеличение количества "соседей" His 683.

Рассмотрим теперь остаток, который, наоборот, становится более экспонированным при переходе в закрытую форму.

pro_385_open.png

Pro 385 (желтый) и его непосредственное (5 ангстрем) окружение (белое) в открытой форме белка.
Остаток расположен в петле, выходящей на поверхности белка и имеет гидрофобное окружение.

pro_385_closed.png

Pro 385 (желтый) и его непосредственное (5 ангстрем) окружение (белое) в закрытой форме белка.
С переходом в закрытую форму петля, в которой расположен Pro 385, несколько смещается в сторону раствора. А с ней и Pro 385.

Таким образом, при переходе между формами в олигопептидазе В сильнее всего меняют экспонированность остатки, расположенные в петлях. Это разумно, ведь как раз петли являются гибкими в отличие от жестких элементов вторичной структуры.