Prody, синтез Фурье

Задание 1. Prody и B-факторы

В этом и следующем задании я рассматривал структуру 5S9Q — бромодомен из BRD4 — хроматинсвязывающего белка, узнающего ацетилированный лизин в составе гистонов.

С помощью Prody можно получить информацию об остатках с самым высоким и самым низким средним значением B-фактора. На Рис. 1 изображена структура белка целиком с отмеченными цветом такими остатками.

Мы видим, что самый высокий B-фактор у остатка глутаминовой кислоты-168 на C-конце цепи A данного белка. В практикуме 2 мы показали, что именно эти остатки соответствуют зонам остова с самой низкой электронной плотностью.

Изображение не найдено. Вы можете сообщить об этом: daniil (dot) bobrovsky (at) fbb (dot) msu (dot) ru
Рис. 1. Остаток структуры 5S9Q с самым высоким (фиолетовым) и с самым низким (зеленым) средним значением B-фактора.

В то же время, самый низкий B-фактор у остатка пролина-82 в цепи B. Из его окружения, изображенного на Рис. 2, становится очевидно, почему подвижность данного остатка такая низкая: он с двух сторон окружен гидрофобными триптофаном и фенилаланином, а с еще одной стороны находится лиганд - ингибитор бромодомена BRD4. Таким образом, наименее подвижной оказывается область белка, участвующая в связывании изучаемого авторами структуры лиганда.

Изображение не найдено. Вы можете сообщить об этом: daniil (dot) bobrovsky (at) fbb (dot) msu (dot) ru
Рис. 2. Окружение остатка структуры 5S9Q с самым низким значением B-фактора (сам остаток покрашен зеленым).

Код, использованный мной для выполнение данного и следующего задания:

import prody as prd
import numpy as np
import matplotlib.pyplot as plt

prot = prd.parsePDB('5s9q')

mean_betas = []
for resi in prot.iterResidues():
    mean_betas.append([resi,np.mean(resi.getBetas())])
sorted(mean_betas,key=lambda i: i[1])[0]
sorted(mean_betas,key=lambda i: i[1])[-1]

prot_mass_center = prd.calcCenter(prot,weights=prot.getMasses())
distances = np.empty(0)
mean_betas = np.empty(0)
chains = np.empty(0)
for resi in prot.iterResidues():
    if 'CA' in resi.getNames():
        chains = np.append(chains,resi.getChids()[0])
        mean_betas = np.append(mean_betas,np.mean(resi.getBetas()))
        distances = np.append(distances, prd.calcDistance(prot_mass_center,
                                          prd.calcCenter(resi, weights=resi.getMasses())))
colors = {'A': 'red', 'B': 'blue', 'D': 'green', 'E': 'orange'}
fig,axes = plt.subplots(2,2,figsize=(12,12))
for i, chain in enumerate(np.unique(chains)):
    ix = np.where(chains == chain)
    ax = axes[i//2][i%2]
    ax.scatter(distances[ix], mean_betas[ix],
                            c = colors[chain], label = chain, s = 10)
    ax.set_title(f"Chain {chain}")
    ax.set_xlabel("Distance between mass centers, Å")
    ax.set_ylabel("Beta factor")
fig.show()
				

Задание 2. Prody, B-фактор и центр масс

В этом задании мы изучали зависимость среднего B-фактора остатка от расстояния, на котором центр масс остатка находится от центра масс всего белка. Полученный с помощью Prody график приведен на Рис. 3. Поскольку данный белок состоит из четырех цепей, симметрично окружающих центр масс, мы решили рассматривать их по отдельности.

Изображение не найдено. Вы можете сообщить об этом: daniil (dot) bobrovsky (at) fbb (dot) msu (dot) ru
Рис. 3. Зависимость среднего B-фактора остатков структуры 5S9Q от расстояния, на котором центр масс остатков находится от центра масс соответствующей цепи (остатки разных цепей белка показаны по отдельности).

Для каждой субъединицы мы наблюдаем не очень резкий, однако все же рост B-фактора с увеличением расстояния от центра масс (так, у остатков, сильно отдаленных от центра масс, не бывает совсем уж низких B-факторов). Это неудивительно и, вероятно, связано с тем, что ядро субъединицы в среднем менее подвижно, чем остатки у поверхности.

Задание 3. Восстановление функции электронной плотности

Для данного задания я выбрал распределение электронной плотности, условно соответствующуее нитрит иону (NO2-) и молекуле воды.

Результаты экспериментов по восстановлению функции с разными параметрами и разными пропущенными гармониками доступны в Таблице 1 и на Рис. 4-6.

Изображение не найдено. Вы можете сообщить об этом: daniil (dot) bobrovsky (at) fbb (dot) msu (dot) ru
Рис. 4. Восстановление электронной плотности по полным наборам гармоник.

На рис. 4 мы видим, что качество восстановления растет с повышением числа гармоник.

Изображение не найдено. Вы можете сообщить об этом: daniil (dot) bobrovsky (at) fbb (dot) msu (dot) ru
Рис. 5. Восстановление электронной плотности по полным наборам гармоник с добавлением шума.

Из рис. 5 мы можем заключить, что "замушление" фазы приводит даже к большим последствиям, чем "зашумление" амплитуды, что говорит о значимости фазовой проблемы и поисков путей ее решения. Так, даже при большом шуме амплитуды (левый нижний график) максимумы атомов нитрит иона и кислорода молекулы воды остаются практически неизменными, а шум не сильно превышает максимумы атомов водородов воды. В то же время, при зашумлении фазы (см. правый нижний график) максимумы атомов нитрит иона и кислорода молекулы воды становятся заметно ниже теоретических, а шум в целом добавляет новые максимумы, не соответствующие никаким атомам и при этом относительно высокие (сравн. с шумом при зашумлении амплитуды).

Изображение не найдено. Вы можете сообщить об этом: daniil (dot) bobrovsky (at) fbb (dot) msu (dot) ru
Рис. 6. Восстановление электронной плотности по неполным наборам гармоник.

Из рис. 6 мы можем заключить, что пропущенные первые гармоники приводят сразу к довольно значительным искажениям графика, как и пропуск значительного числа гармоник в середине. В то же время, добавление одной или даже нескольких гармоник с высокими номерами приводит лишь к незначительным изменениям.

Следовательно, формально высокое разрешение, указанное для последних двух измерений в таблице, совершенно не означает высокого качества восстановления электронной плотности. Поэтому более разумным методом определения разрешения было бы сохранять полноту данных на относительно высоком уровне (>85-90%) и с учетом этого считать разрешение.