Молекулярная динамика биологических молекул в GROMACS

Моделирование перехода ДНК из А в В форму

Даны файлы:

  • Координаты дуплекса ДНК, dna.pdb.
  • параметры для минимизации энегрии em.mdp.
  • параметры для "утряски" воды pr.mdp.
  • параметры молекуляной динамики md.mdp.

С помощью прогаммы fiber из пакета 3DNA строим небольшой дуплекс с последовательностью GATCTA. При создании не забывам проконтролировать отсутствие 5' фосфата в структуре дуплекса, а также имена нуклеотидов должны быть вида "DN", а также не должно быть атома с именем "C5M", если такой есть, то его нужно переименовать на "С7".

Теперь можно построить файл топологии системы в силовом поле amber99sb и файл с координатами в формате Gromacs.

In []:
%%bash
pdb2gmx -f dna.pdb -o dna -p dna -ff amber99sb -water tip3p

Создадим небольшой отступ в ячейке от ДНК.

In []:
%%bash
editconf -f dna.gro -o dna_ec -d 1.5

Проведем оптимиацию геометрии системы, чтобы удалить "плохие" контакты в молекуле.

In []:
%%bash
grompp -f em -c dna_ec -p dna -o dna_em -maxwarn 1
mdrun -deffnm dna_em -v

Изменение максимальной силы в ходе оптимизации геометрии: * Step 0, Fmax=4.810e+03 (atom 12) * Step 121, Fmax=1.323e+03 (atom 304)

Добавим в ячейку молекулу воды:

In []:
%%bash
genbox -cp dna_em -p dna -cs -o dna_s

Нейтрализуем заряд системы. Это делаем в два шага: строим tpr и запускаем genion.

In []:
%%bash
grompp -f em -p dna -c dna_s -o dna_s -maxwarn 5

Так как заряд системы равен "System has non-zero total charge: -9.999999", то нужно до добавить 10 положитетельных зарядов.(выбираем группу "SOL")

In []:
%%bash
genion -s dna_s -o dna_si -p dna -np 10

Переведем полученные файлы dna_si.gro и dna_pr.gro в pdb-формат

In []:
%%bash
editconf -f dna_si.gro -o dna_si.pdb
editconf -f dna_pr.gro -o dna_pr.pdb
In [1]:
from IPython.display import Image
In [2]:
Image('dna_si.png')
Out[2]:
In [3]:
Image('dna_pr.png')
Out[3]:

Как видно на визуализации в Pymol до утряски молекулы воды имели более упорядоченное расположение в пространстве, а после утряски молекулы воды располагаются более хаотично.

Так как во время запуска подсчет на суперкомпьютере был невозможен, то весь последующий анализ результатов выполялся с предоставленными нам файлами прошлых лет. (Когда-то номер задачи был : 1044487).

Все операции, произведенные ранее, были выполнены с файлами, там же лежит исходный файл.ipynb