In [1]:
!ls
#amylase_h.pdb.1#	       complex.1.pdb
#posre.itp.1#		       complex.2.pdb
#posre.itp.2#		       complex.3.pdb
#posre_Ion_chain_C2.itp.1#     create.pl
#posre_Protein_chain_C.itp.1#  create_lig
#rmsd.xvg.1#		       ideal.pdb
#rmsd.xvg.2#		       ideal_h.pdb
#rmsd.xvg.3#		       posre.itp
#rmsd.xvg.4#		       posre_Ion_chain_C2.itp
#rmsd.xvg.5#		       posre_Protein_chain_C.itp
#rmsd.xvg.6#		       posre_Protein_chain_D.itp
#rmsd.xvg.7#		       posre_Protein_chain_D2.itp
#rmsd.xvg.8#		       prac11.ipynb
#rmsd.xvg.9#		       res.out
#temp.xvg.1#		       rmsd.xvg
#topol.top.1#		       rmsd_zdouck.txt
#topol.top.2#		       script.pml
#topol.top.3#		       temp.xvg
#topol.top.4#		       top3.out
#topol.top.5#		       topol.top
#topol.top.6#		       topol_Ion_chain_C2.itp
#topol_Ion_chain_C2.itp.1#     topol_Protein_chain_C.itp
#topol_Protein_chain_C.itp.1#  topol_Protein_chain_D.itp
1_h.pdb			       topol_Protein_chain_D2.itp
amylase.pdb		       toprank.txt
amylase_h.pdb		       uniCHARMM
amylase_m.pdb		       zdock.out
calc.pl			       zdock.out.cp
camelid.pdb		       zdock.out.cp.gr
camelid_h.pdb		       zdock.out.cp.zr.out
camelid_m.pdb

скачали файлы рецептора amilase.pdb и лиганда camelid.pdb Добавили водороды к обоим скачанным файлам с помощью команды pdb2gmx -f мой.pdb -o мой_h.pdb -p

С помощью утилиты mark_sur подсчитали представленность каждого остатка на поверхности mark_sur my.pdb my_m.pdb Запустили zdock Проверили предварительный анализ результатов докинга zrank zdock.out.cp 1 2000 sort -n -k2 zdock.out.cp.zr.out | head

In [3]:
!sort -n -k2 zdock.out.cp.zr.out | head
1588	-28.661
1252	-27.5357
610	-25.5514
1436	-22.3979
1952	-21.1778
982	-17.5643
1284	-16.9435
851	-14.7227
679	-13.8186
1666	-11.6282

Визуализируем первые три лучших по энергии комплекса и сравним с эталоном (структура 1kxt)

Для этого воспользуемся скриптом ./create.pl, применив его к файлу с данными только для лучших комплексов

In [4]:
!./create.pl top_en_3.out 
In [8]:
from IPython.display import Image
Image(filename='result/top1.png')
Out[8]:
In [9]:
Image(filename='result/top2.png')
Out[9]:
In [10]:
Image(filename='result/top3.png')
Out[10]:

Видим, что два предсказанных комплекса несильно отличаются от исходного

Посмотрим, есть ли более хорошие находки

Для этого изменим скрипт create.pl так, чтобы он считал rmsd между предсказанным и реальным положением camelid (script calc.pl). Запустим его для всего zdockout и проранжируем находки (вначале rmsd, потом номер комплекса)

In [14]:
!head toprank.txt
2.486 2
4.826 435
5.004 941
6.051 1371
6.138 709
6.206 202
6.265 1179
6.291 1820
6.383 933
6.633 65

для первого и второго получаем почти идеальное совпадение

In [25]:
Image(filename='result/ideal.png')
Out[25]:
In [26]:
Image(filename='result/ideal2.png')
Out[26]: