Суть задания ознакомиться с программой ZDOCK и сделать предсказание о свзывании фрагмента антитела (VHH domain) c панкреатической альфа-амилазой.
Файлы:
amilase.pdb
camelid.pdb
uniCHARMM

Сначала были добавлены водороды:

pdb2gmx -f amilase.pdb -o amilase_h.pdb -p  -ignh
pdb2gmx -f camelid.pdb -o camelid_h.pdb -p  -ignh

С помощью утилиты mark_sur проведен препроцессинг файлов pdb.

                                  
mark_sur amilase_h.pdb amilase_h_m.pdb
mark_sur camelid_h.pdb camelid_h_m.pdb
Результаты:amilase_h_m.pdb, camelid_h_m.pdb. Утилита mark_sur добавляет информацию о радиусе, заряде и типе атомов. Для дальнейшей работы из выходных файлов были удалены строчки MODEL и TER. И, собственно, запущен докинг:
zdock -R amilase_h_m.pdb -L camelid_h_m.pdb
Результирующий файл - zdock.out. Для работы утилиты zrank необходимо, чтобы в pdb-файлах перед строчками, описывающими атомами была хотя бы одна пустая строка. Так же нужно удалить вторую строчку из zdock.out.
zrank zdock.out 1 2000
Результат - таблица, где напротив каждой модели указан ее вес.
Создание pdb-файлов моделей:
create.pl zdock.out
Для работы этой утилиты нужен файл create_lig. Так же понадобилось удалить третий столбец в первой строчке файла zdock.out. Тогда результатом работы create.pl является 1999 pdb-файлов моделей. Я открыла 5 случайных файлов, в которых связывание белков достаточно разнообразны. По оценкам zrank score было отобрано 3 файла, имеющих наименьшую энергию. Изображения можно будет увидеть ниже. Затем, с помощью g_rms, было посчитано rmsd каждой моели относительно известной структуры 1kxt. (Очень важно перед началом работы удалить водороды из pdb файлов)
for i in {1..2000}; do sed /^$/d ../complex.${i}.pdb > ${i}.pdb;
	babel -d -ipdb ${i}.pdb -opdb ${i}_noh.pdb ;
	echo -e "1\n1\n" | g_rms -f ${i}_noh.pdb -s ../kxt.pdb -o rmsd${i}; 
	echo -n "${i}   " >> RMS;
	grep ' -1.0000000'  rmsd${i}.xvg >> RMS;
done
№	zrank score	RMSD
##################################
1588	-28,661		2,5344827
1252	-27,5357	1,6861778
610	-25,5514	1,9159631

1879	0		1,4554459
1114	0		1,4688028
1182	0		1,4694291

Первые три структуры имеют лучшую энергию, а вторая тройка - самое минимальное квадратичное отклонение от 1kxt.
Изображения:
1588 1252 610
1879 1114 1182
Очень странная структура записана в этом файле. Очень странная структура записана в этом файле.
И, собственно, 1kxt:
Видно, что на рефересную структуру больше всего похожи 610 и 1879 модели. Хотя вариация достаточно большая. 114 и 1182 модели вообще какие-то странные и не отображают структуры комплекса. Вообще, можно сказать, что резуьтаты получились не очень хорошие, возможно, имеет смысл использовать -D для докинга с помощью zdock