import prody
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from IPython.display import Image


structure = prody.parsePDB('7bcp', secondary = True)

@> PDB file is found in working directory (7bcp.pdb.gz).
@> 5105 atoms and 1 coordinate set(s) were parsed in 0.05s.
@> Secondary structures were assigned to 252 residues.


protein = structure.select('protein and chain A')
prot = protein.toAtomGroup()


df = pd.DataFrame(columns = ['MeanBeta', 'Dist', 'SecStr', 'Color', 'Size'])
color = 'blue'
size = 10
residues_ss = []
pmc = prody.calcCenter(prot, weights = prot.getMasses())
for res in prot.iterResidues():
    if "CA" in res.getNames():
        ss = res.getSecstrs()
        beta = np.mean(res.getBetas())
        amc = prody.calcCenter(res, weights = res.getMasses())
        dist = prody.calcDistance(pmc, amc)
        residues_ss.append([res, beta, dist])
        df.loc[str(res.getResname() + str(res.getResnum()))] = [beta, dist, ssk[ss[0]], color, size]


print(df.MeanBeta.idxmax(), max(df.MeanBeta)) # Определили остаток с максимальным средним B-фактором

ARG309 61.69291666666667


print(df.MeanBeta.idxmin(), min(df.MeanBeta)) # Определили остаток с минимальным средним B-фактором

ASN153 21.615714285714287


Image("1_1.png")


df['Color'][df.MeanBeta.idxmax()] = 'red'
df['Color'][df.MeanBeta.idxmin()] = 'green'
df['Size'][df.MeanBeta.idxmax()] = 20
df['Size'][df.MeanBeta.idxmin()] = 20


df['Size'] = pd.to_numeric(df['Size'])


fig, ax = plt.subplots()
fig.set_size_inches(10, 7)
SMALL_SIZE = 14
MEDIUM_SIZE = 16

plt.rc('font', size=SMALL_SIZE)          
plt.rc('axes', titlesize=SMALL_SIZE)     
plt.rc('axes', labelsize=MEDIUM_SIZE)    
plt.rc('xtick', labelsize=SMALL_SIZE)    
plt.rc('ytick', labelsize=SMALL_SIZE)
ax.scatter(df['Dist'], df['MeanBeta'], s = df['Size'], color = df['Color'])
ax.set_xlabel('Distance to protein mass center, Å')
ax.set_ylabel('Beta factor')
plt.show()


# Соотнесение однобуквенных кодов вторичной структуры согласно мануалу Prody, стр. 62-63
# https://buildmedia.readthedocs.org/media/pdf/prody/v1.5/prody.pdf
ssk = {'H': 'helix',
'G': 'helix310',
'I': 'helixpi',
'T': 'turn',
'B': 'bridge',
'S': 'bend',
'C': 'coil', # Прочие конформации
'E': 'extended'} # Соответствует тяжам В-листа


fig, ax = plt.subplots()
fig.set_size_inches(10, 7)
SMALL_SIZE = 14
MEDIUM_SIZE = 16

plt.rc('font', size=SMALL_SIZE)          
plt.rc('axes', titlesize=SMALL_SIZE)     
plt.rc('axes', labelsize=MEDIUM_SIZE)    
plt.rc('xtick', labelsize=SMALL_SIZE)    
plt.rc('ytick', labelsize=SMALL_SIZE)
sns.scatterplot(x = df['Dist'],y = df['MeanBeta'], hue = df['SecStr'])
ax.set_xlabel('Distance to protein mass center, Å')
ax.set_ylabel('Mean Beta factor')
plt.show()


fig, ax = plt.subplots()
fig.set_size_inches(10, 7)
SMALL_SIZE = 14
MEDIUM_SIZE = 16

plt.rc('font', size=SMALL_SIZE)          
plt.rc('axes', titlesize=SMALL_SIZE)     
plt.rc('axes', labelsize=MEDIUM_SIZE)    
plt.rc('xtick', labelsize=SMALL_SIZE)    
plt.rc('ytick', labelsize=SMALL_SIZE)
sns.boxplot(x = df['MeanBeta'],y = df['SecStr'])
ax.set_xlabel('Beta factor')
ax.set_ylabel('Secondary structure')
plt.show()


run  ../scripts/compile-func.py -g 25,3,6+38,3,7.5+23,3.4,8.8+2,3.5,13+30,3,14.1+27,3.1,15.3

File func.txt created


run ../scripts/func2fourier.py -o four.txt

..Done


run ../scripts/fourier-filter.py -i four.txt -o f05.txt -r 0-5

..Done


run ../scripts/fourier2func.py -f func.txt -i f05.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f010.txt -r 0-10

..Done


run ../scripts/fourier2func.py -f func.txt -i f010.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f020.txt -r 0-20

..Done


run ../scripts/fourier2func.py -f func.txt -i f020.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f030.txt -r 0-30

..Done


run ../scripts/fourier2func.py -f func.txt -i f030.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f045.txt -r 0-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f045.txt

File two_func.txt with function and its recovering is created


run ../scripts/func2fourier.py -o fourF30.txt -F 30

..Done


run ../scripts/fourier-filter.py -i fourF30.txt -o f045F30.txt -r 0-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f045F30.txt

File two_func.txt with function and its recovering is created


run ../scripts/func2fourier.py -o fourF60.txt -F 60

..Done


run ../scripts/fourier-filter.py -i fourF60.txt -o f045F60.txt -r 0-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f045F60.txt

File two_func.txt with function and its recovering is created


run ../scripts/func2fourier.py -o fourP30.txt -P 30

..Done


run ../scripts/fourier-filter.py -i fourP30.txt -o f045P30.txt -r 0-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f045P30.txt

File two_func.txt with function and its recovering is created


run ../scripts/func2fourier.py -o fourP60.txt -P 60

..Done


run ../scripts/fourier-filter.py -i fourP60.txt -o f045P60.txt -r 0-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f045P60.txt

File two_func.txt with function and its recovering is created


run ../scripts/func2fourier.py -o fourP30F30.txt -P 30 -F 30

..Done


run ../scripts/fourier-filter.py -i fourP30F30.txt -o f045P30F30.txt -r 0-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f045P30F30.txt

File two_func.txt with function and its recovering is created


run ../scripts/func2fourier.py -o fourP60F60.txt -P 60 -F 60

..Done


run ../scripts/fourier-filter.py -i fourP60F60.txt -o f045P60F60.txt -r 0-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f045P60F60.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f245.txt -r 2-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f245.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f845.txt -r 8-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f845.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f08-1345.txt -r 0-8,13-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f08-1345.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f025-3045.txt -r 0-25,30-45

..Done


run ../scripts/fourier2func.py -f func.txt -i f025-3045.txt

File two_func.txt with function and its recovering is created


run ../scripts/fourier-filter.py -i four.txt -o f045-55.txt -r 0-45,55

..Done


run ../scripts/fourier2func.py -f func.txt -i f045-55.txt

File two_func.txt with function and its recovering is created

Практикум 4¶

Задание 1. Prody и B-факторы часть 1.¶

Рисунок 1. Остатки с наибольшим (ARG309) и наименьшим (ASN153) средним B-фактором¶

Задание 2. Prody и B-факторы часть 2.¶

Рисунок 2. Средние B-факторы и расстояния до центра масс. Красная точка - ARG-309, зеленая - ASN-153.¶

Рисунок 3. Средние B-факторы и расстояния до центра масс. Раскраска по вторичной структуре.¶

Рисунок 4. Разброс средних B-факторов для остатков из разных вторичных структур.¶

Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным.¶

Рисунок 5. Исходная функция электронной плотности. Маленький пик моделирует атом водорода.¶

Полный набор гармоник¶

Рисунок 6. Восстановление исходной функции по набору гармоник n = 0 - 5.¶

Рисунок 7. Восстановление исходной функции по набору гармоник n = 0 - 10.¶

Рисунок 8. Восстановление исходной функции по набору гармоник n = 0 - 20.¶

Рисунок 9. Восстановление исходной функции по набору гармоник n = 0 - 30.¶

Рисунок 10. Восстановление исходной функции по набору гармоник n = 0 - 45.¶

Восстановление по полному набору гармоник с добавленным шумом¶

Рисунок 11. Восстановление с шумом амплитуды 30%.¶

Рисунок 12. Восстановление с шумом амплитуды 60%.¶

Рисунок 13. Восстановление с шумом фазы 30%.¶

Рисунок 14. Восстановление с шумом фазы 60%.¶

Рисунок 15. Восстановление с шумом фазы 30% и амплитуды 30%.¶

Рисунок 16. Восстановление с шумом фазы 60% и амплитуды 60%.¶

Восстановление по неполному набору гармоник¶

Рисунок 17. Восстановление по набору гармоник n = 2 - 45.¶

Рисунок 18. Восстановление по набору гармоник n = 8 - 45.¶

Рисунок 19. Восстановление по набору гармоник n = 0 - 8, 13 - 45.¶

Рисунок 20. Восстановление по набору гармоник n = 0 - 25, 30 - 45.¶

Рисунок 21. Восстановление по набору гармоник n = 0 - 45, 55.¶