Даны файлы:
С помощью прогаммы fiber из пакета 3DNA строим небольшой дуплекс с последовательностью GATCTA. При создании не забывам проконтролировать отсутствие 5' фосфата в структуре дуплекса, а также имена нуклеотидов должны быть вида "DN", а также не должно быть атома с именем "C5M", если такой есть, то его нужно переименовать на "С7".
Теперь можно построить файл топологии системы в силовом поле amber99sb и файл с координатами в формате Gromacs.
%%bash
pdb2gmx -f dna.pdb -o dna -p dna -ff amber99sb -water tip3p
Создадим небольшой отступ в ячейке от ДНК.
%%bash
editconf -f dna.gro -o dna_ec -d 1.5
Проведем оптимиацию геометрии системы, чтобы удалить "плохие" контакты в молекуле.
%%bash
grompp -f em -c dna_ec -p dna -o dna_em -maxwarn 1
mdrun -deffnm dna_em -v
Изменение максимальной силы в ходе оптимизации геометрии: * Step 0, Fmax=4.810e+03 (atom 12) * Step 121, Fmax=1.323e+03 (atom 304)
Добавим в ячейку молекулу воды:
%%bash
genbox -cp dna_em -p dna -cs -o dna_s
Нейтрализуем заряд системы. Это делаем в два шага: строим tpr и запускаем genion.
%%bash
grompp -f em -p dna -c dna_s -o dna_s -maxwarn 5
Так как заряд системы равен "System has non-zero total charge: -9.999999", то нужно до добавить 10 положитетельных зарядов.(выбираем группу "SOL")
%%bash
genion -s dna_s -o dna_si -p dna -np 10
Переведем полученные файлы dna_si.gro и dna_pr.gro в pdb-формат
%%bash
editconf -f dna_si.gro -o dna_si.pdb
editconf -f dna_pr.gro -o dna_pr.pdb
from IPython.display import Image
Image('dna_si.png')
Image('dna_pr.png')
Как видно на визуализации в Pymol до утряски молекулы воды имели более упорядоченное расположение в пространстве, а после утряски молекулы воды располагаются более хаотично.
Так как во время запуска подсчет на суперкомпьютере был невозможен, то весь последующий анализ результатов выполялся с предоставленными нам файлами прошлых лет. (Когда-то номер задачи был : 1044487).
Все операции, произведенные ранее, были выполнены с файлами, там же лежит исходный файл.ipynb