На этом занятии мы будем изучать, как реализован контроль температуры в молекулярной динамике на примере GROMACS. Объект исследования - одна молекула этана.

Нам предоставлен gro файл(http://kodomo.fbb.msu.ru/FBB/year_08/term6/etane.gro) с координатами этана.

Начнем с того, что подготовим файл топологии et.top. Есть заготовка, куда нужно вписать номера атомов, образующих связи, плоские и торсионные углы.

In [1]:
# загрузим модули
import rdkit
from rdkit import Chem
from rdkit.Chem import AllChem, Draw
from rdkit.Chem import Descriptors
from rdkit import RDConfig
from IPython.display import Image,display
import numpy as np
In [2]:
# создадим этан
AllChem.MMFFOptimizeMolecule(m3d,maxIters=500,nonBondedThresh=200 )
In [3]:
# и придумаем циклы 
## связи
bonds = m3d.GetBonds()
for i,b in enumerate(bonds):
    print b.GetBeginAtomIdx()+1 , b.GetEndAtomIdx()+1
1 2
1 3
1 4
1 5
2 6
2 7
2 8
In [4]:
## углы    
for b1 in m3d.GetBonds():
    for b2 in m3d.GetBonds():
        if b1.GetBeginAtomIdx() == b2.GetBeginAtomIdx() and b1.GetIdx() != b2.GetIdx():
            print '    ',b1.GetEndAtomIdx()+1,'     ',b1.GetBeginAtomIdx()+1,'     ',b2.GetEndAtomIdx()+1,'     ','1'
     2       1       3       1
     2       1       4       1
     2       1       5       1
     3       1       2       1
     3       1       4       1
     3       1       5       1
     4       1       2       1
     4       1       3       1
     4       1       5       1
     5       1       2       1
     5       1       3       1
     5       1       4       1
     6       2       7       1
     6       2       8       1
     7       2       6       1
     7       2       8       1
     8       2       6       1
     8       2       7       1
In [5]:
## торсионные углы: с повторами, в файле убрала одинаковые углы    
for b1 in m3d.GetBonds():
    for b2 in m3d.GetBonds():
        for b3 in m3d.GetBonds():
            if b1.GetBeginAtomIdx() == b2.GetBeginAtomIdx() and b1.GetIdx() != b2.GetIdx() and b2.GetEndAtomIdx()==b3.GetBeginAtomIdx() and b3.GetIdx() != b2.GetIdx():
                print ' ',b1.GetEndAtomIdx()+1,'   ',b1.GetBeginAtomIdx()+1,'   ',b2.GetEndAtomIdx()+1,'   ',b3.GetEndAtomIdx()+1,'   ','3'
  3     1     2     6     3
  3     1     2     7     3
  3     1     2     8     3
  4     1     2     6     3
  4     1     2     7     3
  4     1     2     8     3
  5     1     2     6     3
  5     1     2     7     3
  5     1     2     8     3

Посмотрим, какой тип атома у углерода в этане: есть строчка такая:

opls_067 15.03500 ; CH3 (C1) ETHANE


opls_139 12.01100 ; alkane C

и такая:

opls_140 1.00800 ; alkane H.

Возьмем два соседних номера, 139 и 140.

Даны 5 файлов с разными параметрами контроля температуры:

be.mdp - метод Берендсена для контроля температуры.

vr.mdp - метод "Velocity rescale" для контроля температуры.

nh.mdp - метод Нуза-Хувера для контроля температуры.

an.mdp - метод Андерсена для контроля температуры.

sd.mdp - метод стохастической молекулярной динамики.

Найдём различия между этими методами.

In [7]:
wget http://kodomo.fbb.msu.ru/FBB/year_08/term6/etane.gro
wget http://kodomo.fbb.msu.ru/FBB/year_08/term6/be.mdp
wget http://kodomo.fbb.msu.ru/FBB/year_08/term6/vr.mdp
wget http://kodomo.fbb.msu.ru/FBB/year_08/term6/nh.mdp
wget http://kodomo.fbb.msu.ru/FBB/year_08/term6/an.mdp
wget http://kodomo.fbb.msu.ru/FBB/year_08/term6/sd.mdp
In [2]:
import subprocess
for filename in ['be','vr','nh','an','sd']:
    cmd = 'grompp -f %s.mdp -c etane.gro -p et.top -o et_%s.tpr >& log.grompp' %(filename,filename)

# где i: be,vr,nh,an,sd  см. выше список mdp файлов
In [3]:
for filename in ['be','vr','nh','an','sd']:
    cmd = 'mdrun -deffnm et_%s.tpr -v -nt 1' %filename

Можно конвертировать tpr файлы в pdb и посмотреть на них в PyMol, используя команду smooth.

et_an слабо колеблется;

et_be, et_nh, et_vr довольно похожи по характеру движения, движутся по кругу в разных плоскостях и с разной амплитудой. Быстро вращаются вокруг С-С связи;

et_sd быстро и беспорядочно движется во всех направлениях, улетая от начального положения дальше всех.

Теперь сравним потенциальную энергию связи и кинетическую энергию для каждой из 5 систем.

In [4]:
for filename in ['be','vr','nh','an','sd']:
    cmd1 = 'echo 10 | g_energy -f et_%s.tpr.edr -o et_%s_pot_en.xvg -xvg none >& log.g_energy' %(filename,filename)
    cmd2 = 'echo 11 | g_energy -f et_%s.tpr.edr -o et_%s_kin_en.xvg -xvg none >& log.g_energy' %(filename,filename)
In [1]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
for filename in ['be','vr','nh','an','sd']:
    a= np.loadtxt('et_%s_pot_en.xvg' % filename)
    b= np.loadtxt('et_%s_kin_en.xvg' % filename)
    plt.plot(t1, y1, "b-", t2, y2, "r-" )
    red_patch = mpatches.Patch(color='red', label='Kinetic')
    blue_patch = mpatches.Patch(color='blue', label='Potential')
    plt.title('Energies of %s system' % filename) 

Амплитуда колебаний у be уменьшается со временем, это отличает её от остальных систем. У остальных она сохраняется. Различаются только абсолютные значения амплитуды: самые маленькие у an, самые большие у nh.

Рассмотрим распределение длины связи С-С за время моделирования.

In [2]:
import subprocess
for filename in ['be','vr','nh','an','sd']:
    cmd = 'g_bond -f et_%s.tpr.trr -s et_%s.tpr -o bond_%s.xvg -n b.ndx -xvg none' % (filename,filename,filename)
In [3]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
for filename in ['be','vr','nh','an','sd']:
    a= np.loadtxt('bond_%s.xvg' % filename)
    width = 0.0001 #эмпирически
    plt.bar(t1,y1,width, color="blue")
    plt.title('Length of C-C bond in %s system' % filename)

По форме на распределение Больцмана похожи только be и nh.

Их максимум находится в 1.53, что соответствует длине связи С-С. Остальные распределения не только не похожи на распределение Больцмана, но и имеют отличающиеся от 1.53 максимумы. У an в 1.53 вообще минимум.

nh лучше всего подходит, как как не симметрично полностью, а имеет правый хвост длиннее левого (как в распределении Больцмана).

In [4]:
import subprocess
for filename in ['be','vr','nh','an','sd']:
    cmd1 = 'grompp -f %s.mdp -c etane.gro -p et.top -o et_%s.tpr >& log.grompp' %(filename,filename)
    cmd2 = 'mdrun -deffnm et_%s.tpr -v -nt 1' %filename
    output_file = open(filename+'.sh','w')
In [5]:
chmod +x *.sh
Анализ времени работы по данным из GROMACS:

be 3.770 s

vr 3.820 s

nh 3.840 s

an 3.710 s

sd 4.330 s

an самый быстрый, sd самый медленный. Для sd координаты молекул изменяются сильнее всего, поэтому он и работает дольше всех.

In [ ]: