В данном задании сравнивались структуры одного и того же белка, полученные методом РСА и ЯМР. Мне достались структуры интерлейкина 8 человека. Это белок, относящийся к хемокинам, играет важную роль в развитии воспалительного ответа, он участвует в направлении движения лейкоцитов к месту воспаления. Как и другие хемокины, он организован в структуру, известную как "греческий ключ". Использовались структуры этого белка полученные различными методами:
При помощи PyMol эти структуры были совмещены (зеленым отображаются модели, полученные при помощи ЯМР, цианом - полученные при помощи РСА):
Заметно, что основные элементы вторичной структуры достаточно хорошо совпадают, за исключением самого короткого из b-тяжей (отмечено красной стрелочкой), положение которого и соседствующей с ним петли отличается. Возможно эти различия могут объясняться тем, что при ЯМР белок находится в растворе, в то время как при методе РСА могут происходить изменения при получении кристалла. На С-концевой альфа-спирали в модели ЯМР отсутствуют несколько аминокислот. Также есть существенные различия в петле N-конца, однако там заметна большая разница и между моделями ЯМР, возможно подобные различия могут объясняться большой подвижностью. Также бросается в глаза, что на структуре, полученной с помощью ЯМР отсутствуют молекулы воды.
В данном задании требовалось оценить наличие взаимосвязи между значениями RMSF, вычесленным по набору моделей ЯМР с В-фактором модели РСА. Совпадающие участки были выбраны при помощи Pymol.
import prody as prd
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
RSA=prd.parsePDB('4xdx')
NMR = prd.parsePDB('6xmn', chain='A')
@> Connecting wwPDB FTP server RCSB PDB (USA). @> 4xdx downloaded (C:\Users\79165\...\4xdx.pdb.gz) @> PDB download via FTP completed (1 downloaded, 0 failed). @> 1288 atoms and 1 coordinate set(s) were parsed in 0.04s. @> Connecting wwPDB FTP server RCSB PDB (USA). @> 6xmn downloaded (C:\Users\79165\...\6xmn.pdb.gz) @> PDB download via FTP completed (1 downloaded, 0 failed). @> 1095 atoms and 20 coordinate set(s) were parsed in 0.11s.
RMSF_full = []
RMSFs = []
betas = []
for res in NMR.iterResidues():
if res.getResnum() <=66 and res.getResnum() >=6:
RMSFs.append(np.mean(prd.calcRMSF(res)))
RMSF_full.append([res, np.mean(prd.calcRMSF(res))])
#print(res)
for res in RSA.iterResidues():
if res.getResnum() <= 66 and res.getResnum() >=6:
betas.append(np.mean(res.getBetas()))
#print(res)
fig,ax = plt.subplots()
ax.scatter(RMSFs, betas, s=1)
ax.set_xlabel('RSMF')
ax.set_ylabel('В-фактор')
fig.show()
<ipython-input-8-80082f3df0f2>:5: UserWarning: Matplotlib is currently using module://ipykernel.pylab.backend_inline, which is a non-GUI backend, so cannot show the figure. fig.show()
sorted(RMSF_full, key=lambda x:x[1], reverse=True)[0]
[<Residue: ARG 6 from Chain A from 6xmnA (24 atoms; active #0 of 20 coordsets)>, 2.6157809091102986]
Заметим что один из остатков очень сильно выбивается по значению RMSF, это расположенный на N-конце аргинин, что согласуется с тем что он может обладать большой подвижностью. Однако в целом по полученному графику нельзя сделать выводов о наличии связи B-Фактора с RMSF, таким образом анализ различных моделей ЯМР не позволяет делать выводов о подвижности участков структуры.
В данном задании сравнивалось наличие водородных связей в обеих структурах. Выбирались различные водородные связи в структуре РСА, а затем оценивалось их наличие в моделях ЯМР. Оценка проводилась по расстоянию - считалось что водородная связь есть, если расстояние между соответствующими атомами не превышает 3,5 А.
В качестве первой водородной связи была выбрана связь между атомами остова в альфа-спирали: связь между N из Lys 64 и O из Arg 60
В качестве второй водородной связи требовалось выбрать связь между боковыми радикалами в ядре белка, однако в моем белке ядро стабилизируется гидрофобными взаимодействиями, поэтому найденная связь лежит близко к поверхности. Была выбрана связь между N Gln 8 и O Arg 26. Arg 26 имеет 3 различных альтлока, однако для всех из них сохраняется водородная связь с глутамином, и при анализе моделей ЯМР также считалось что связь есть, если расстояние до одного из азотов не превышает 3.5. (Хотя отметим, что для одного из альтлоков связь всё же сомнительна, так как получается плохой угол)
В качестве третьей связи была выбрана связь в боковой цепи вблизи поверхности белка между азотом His 33 и кислородом остова Glu29
Далее вычислялись расстояния между аналогичными атомами для всех моделей ЯМР.
his33 = NMR["A", 33]["NE2"].getCoordsets()
glu29 = NMR["A", 29]["O"].getCoordsets()
arg26_1 = NMR["A", 26]["NH1"].getCoordsets()
arg26_2 = NMR["A", 26]["NH2"].getCoordsets()
gln8 = NMR["A", 8]["OE1"].getCoordsets()
arg60 = NMR["A", 60]["O"].getCoordsets()
lys64 = NMR["A", 64]["N"].getCoordsets()
bond1 = []
bond2 = []
bond3 = []
for i in range(20):
d = prd.calcDistance(his33[i], glu29[i])
bond3.append(d)
d = min(prd.calcDistance(arg26_1[i], gln8[i]),prd.calcDistance(arg26_2[i], gln8[i]))
bond2.append(d)
d = prd.calcDistance(arg60[i], lys64[i])
bond1.append(d)
hbonds = [sum(list(map(lambda x: x<3.5, bond1))), sum(list(map(lambda x: x<3.5, bond2))), sum(list(map(lambda x: x<3.5, bond3)))]
pd.DataFrame({"Остатки": ['N(lys64)-O(arg60)','N(arg26)-O(gln8)', 'N(his33)-O(glu29)'],
"Расстояние в РСА": [2.9, 2.95, 3],
"Число моделей с водородной связью": hbonds,
"Процент моделей с водонодной связью": [hbonds[0]/20*100, hbonds[1]/20*100, hbonds[2]/20*100],
"Минимальное расстояние": [min(bond1), min(bond2),min(bond3)],
"Максимальное расстояние": [max(bond1), max(bond2),max(bond3)],
"Медианное расстояние": [np.median(bond1),np.median(bond2),np.median(bond3)]})
Остатки | Расстояние в РСА | Число моделей с водородной связью | Процент моделей с водонодной связью | Минимальное расстояние | Максимальное расстояние | Медианное расстояние | |
---|---|---|---|---|---|---|---|
0 | N(lys64)-O(arg60) | 2.90 | 20 | 100.0 | 2.524472 | 2.753961 | 2.683406 |
1 | N(arg26)-O(gln8) | 2.95 | 2 | 10.0 | 2.718016 | 12.602612 | 8.949532 |
2 | N(his33)-O(glu29) | 3.00 | 0 | 0.0 | 3.771924 | 5.526910 | 4.549622 |
Информация о водородных связях в жестких и стабильных структурах (таких как альфа-спираль) хорошо совпадает в стурктурах, полученных обоими методами, в то время как при анализе более подвижных структур модели, полученные методом ЯМР, перестают показывать наличие водородных связей. В полученных результатах кажется несколько странным то, что максимальное и медианное расстояния выше для связи между боковыми цепями "внутри" глобулы, чем для связи на поверхности, мне кажется это может объясняться во-первых тем, что на самом деле связь "внутри" расположена достаточно близко к поверхности (как говорилось выше, пришлось сделать такой выбор из-за отсутствия полярных аминокислот в ядре белка), а во-вторых один из остатков в структуре полученной РСА имеет несколько альтлоков, что говорит о том, что у него может быт несколько стабильных положений, это могло повлиять и на больший разброс значений, полученных методом ЯМР