import prody
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from IPython.display import Image


Image("all.png")


Image("turn.png")


Image("t1_1.png")


Image("arg64_2_all.png")


Image("arg64_1.png")


nmr_7ovc = prody.parsePDB('7ovc')
xray_7nw1 = prody.parseMMCIF('7nw1')
nmr_7ovc_A = nmr_7ovc.select('protein and chain A').toAtomGroup()
xray_7nw1_B = xray_7nw1.select('chain BB').toAtomGroup()

@> PDB file is found in working directory (7ovc.pdb).
@> 3147 atoms and 20 coordinate set(s) were parsed in 0.13s.
@> 3051 atoms and 1 coordinate set(s) were parsed in 0.07s.


xray_resid_beta = pd.DataFrame(columns = ['Res', 'MeanBeta'])
for res in xray_7nw1_B.iterResidues():
    if "CA" in res.getNames():
        beta = np.mean(res.getBetas())
        xray_resid_beta.loc[str(res.getResnum())] = [res.getResname(), beta]


nmr_resid_rmsf = pd.DataFrame(columns = ['Res', 'MeanRMSF'])
for res in nmr_7ovc_A.iterResidues():
    if "CA" in res.getNames():
        rmsf = np.mean(prody.calcRMSF(res))
        nmr_resid_rmsf.loc[str(res.getResnum())] = [res.getResname(), rmsf]


from scipy import stats
stats.spearmanr(xray_resid_beta['MeanBeta'],nmr_resid_rmsf.iloc[2:165, 1])

SpearmanrResult(correlation=0.3327458836960558, pvalue=1.4258689827173595e-05)


fig, ax = plt.subplots()
fig.set_size_inches(10, 7)
SMALL_SIZE = 14
MEDIUM_SIZE = 16
plt.rc('font', size=SMALL_SIZE)          
plt.rc('axes', titlesize=SMALL_SIZE)     
plt.rc('axes', labelsize=MEDIUM_SIZE)    
plt.rc('xtick', labelsize=SMALL_SIZE)    
plt.rc('ytick', labelsize=SMALL_SIZE)
sns.kdeplot(x = xray_resid_beta['MeanBeta'], y = nmr_resid_rmsf.iloc[2:165, 1], fill = True)
sns.scatterplot(x = xray_resid_beta['MeanBeta'], y = nmr_resid_rmsf.iloc[2:165, 1], s = 15, color = 'red', alpha = 0.5)

ax.set_xlabel('Mean Beta factor')
ax.set_ylabel('Mean RMSF')
plt.show()


xray_atom_rmsf = pd.DataFrame(columns = ['Res', 'AtomName', 'RMSF'])
for res in xray_7nw1_B.iterResidues():
    if "CA" in res.getNames():
        for atom in res.iterAtoms():
            if atom.getName()[0] != 'H':
                beta = atom.getBeta()
                rmsf = 3 * beta / 8 / np.pi ** 2
                name = atom.getName()
                xray_atom_rmsf.loc[str(atom.getIndex())] = [res.getResname() + str(res.getResnum()), name ,rmsf]
            else:
                continue


nmr_atom_rmsf = pd.DataFrame(columns = ['Res', 'AtomName', 'RMSF'])
for res in nmr_7ovc_A.iterResidues():
    if "CA" in res.getNames():
        for atom in res.iterAtoms():
            if atom.getName()[0] != 'H':
                rmsf = prody.calcRMSF(res)[np.where(res.getNames() == atom.getName())[0][0]] ** 2
                name = atom.getName()
                nmr_atom_rmsf.loc[str(atom.getIndex())] = [res.getResname() + str(res.getResnum()), name , rmsf]
            else:
                continue


#Проверим, что атомы в двух структурах различаются только на N- и С- концах, где 7OVC длиннее
xray_at = [] 
nmr_at = []
for i in range(len(xray_atom_rmsf)):
    #Имя атома и номер аминокислоты - его идентификатор
    xray_at.append(xray_atom_rmsf.iloc[i, 0] + xray_atom_rmsf.iloc[i, 1]) 
for i in range(len(nmr_atom_rmsf)):
    nmr_at.append(nmr_atom_rmsf.iloc[i, 0] + nmr_atom_rmsf.iloc[i, 1])
st = 0
dif = []
#Ожидаем, что 7NM1 будет совпадать с какой-то связной подпоследовательностью 7ovc по всем атомам
for i in range(0, len(nmr_at)):
    if st < len(xray_at):
        if nmr_at[i] != xray_at[st]:
            dif.append(nmr_at[i])
        else: 
            st = st + 1
    else:
        dif.append(nmr_at[i])
len(dif) == len(nmr_at) - len(xray_at)

True


from scipy import stats
stats.spearmanr(xray_atom_rmsf['RMSF'],nmr_atom_rmsf.iloc[13:1356, 2])

SpearmanrResult(correlation=0.4001641042709147, pvalue=8.278743458390352e-53)


fig, ax = plt.subplots()
fig.set_size_inches(10, 7)
SMALL_SIZE = 14
MEDIUM_SIZE = 16
plt.rc('font', size=SMALL_SIZE)          
plt.rc('axes', titlesize=SMALL_SIZE)     
plt.rc('axes', labelsize=MEDIUM_SIZE)    
plt.rc('xtick', labelsize=SMALL_SIZE)    
plt.rc('ytick', labelsize=SMALL_SIZE)
sns.kdeplot(x = xray_atom_rmsf['RMSF'], y = nmr_atom_rmsf.iloc[13:1356, 2], fill = True)
sns.scatterplot(x = xray_atom_rmsf['RMSF'],y = nmr_atom_rmsf.iloc[13:1356, 2], color = 'red', alpha = 0.3, s = 8)
ax.set_ylabel('RMSF^2 NMR')
ax.set_xlabel('RMSF^2 X-ray')
plt.show()


pairs = [(('ALA', '135', 'O'), ('ALA', '139', 'N')), (('TYR', '90', 'OH'), ('ARG', '31', 'NH2')), (('TYR', '90', 'OH'), ('ARG', '31', 'NH1')), (('ASN', '128', 'OD1'), ('LYS', '131', 'NZ'))]


#Рассчитаем расстояние между атомами в каждом 
df_dist = pd.DataFrame(columns = ['dist_v'])
for i in pairs:
    f = nmr_7ovc_A.select('resnum ' + i[0][1] + ' and name ' + i[0][2]).toAtomGroup()
    s = nmr_7ovc_A.select('resnum ' + i[1][1] + ' and name ' + i[1][2]).toAtomGroup()
    dist = []
    for setf, sets in zip(f.iterCoordsets(), s.iterCoordsets()):
        dist.append(float(prody.calcDistance(setf, sets)))
    df_dist.loc[i[0][0] + i[0][1] + i[0][2] + '-' + i[1][0] + i[1][1] + i[1][2]] = [dist]


#Рассчитаем параметры водородных связей в NMR модели
#Для связи с аргинином учтем, что два азота NH гуанидиновой группы идентичны
df_dist.loc['TYR90OH-ARG31N'] = [[min(i,j) for i,j in zip(df_dist.iloc[1,0], df_dist.iloc[2,0])]]
r_d = ['2,9', '3,5','3,5', '3.1', '3,5']
df_dist['RSA_dist, Å'] = r_d
df_dist['inNMR'] = df_dist.apply(lambda row: len(list(filter(lambda x: x <= 3.5, row.dist_v))), axis = 1)
df_dist['PercNMR, %'] = df_dist.apply(lambda row: row.inNMR/20*100, axis = 1)
df_dist['Min, Å'] = df_dist.apply(lambda row: np.round(np.min(row.dist_v), 2), axis = 1)
df_dist['Max, Å'] = df_dist.apply(lambda row: np.round(np.max(row.dist_v), 2), axis = 1)
df_dist['Median, Å'] = df_dist.apply(lambda row: np.round(np.median(row.dist_v), 2), axis = 1)
df_dist_f = df_dist.iloc[[0,4,3], 1:]


#Итоговая таблица
df_dist_f


Image("t3_1.png")


Image("t3_2.png")


Image("t3_3.png")

	RSA_dist, Å	inNMR	PercNMR, %	Min, Å	Max, Å	Median, Å
ALA135O-ALA139N	2,9	19	95.0	2.89	3.61	3.01
TYR90OH-ARG31N	3,5	6	30.0	3.20	4.40	3.75
ASN128OD1-LYS131NZ	3.1	0	0.0	6.50	10.09	7.27

Практикум 5¶

Задание 1. Вводное¶

Рисунок 1. Общий вид выравненных структур. 7OVC покрашена зеленым, 7NM1 - синим.¶

Рисунок 2. Отличие в положении остовов вне вторичной структуры.¶

Рисунок 3. Взаимодействие между соседями в кристалле.¶

Рисунок 4. Отличное положение остатков аргинина 64 в РСА и ЯМР моделях.¶

Рисунок 5. Взаимодействие между соседями в кристалле.¶

Задание 2. RMSF¶

Рисунок 6. Распределение средних RMSF (ЯМР струкутра) и В-факторов (РСА) для отдельных остатков.¶

Рисунок 7. RMSF, рассчитанные по В-факторам из РСА модели, и RMSF для моделей ЯМР - для каждого атома, кроме водородов.¶

Задание 3¶

Таблица 1. Параметры водородных связей в РСА и ЯМР моделях.¶

Рисунок 8. Водородная связь между ALA-135 и ALA-139, синим - РСА модель, зеленым - ЯМР модели.¶

Рисунок 9. Водородная связь между ARG-31 и TYR-90, синим - РСА модель, зеленым - ЯМР модели.¶

Рисунок 10. Водородная связь между LYS-131 и ASN_128, синим - РСА модель, зеленым - ЯМР модели.¶