-
Программе Autodock Vina для докинга необходимы специально форматированные файлы pdb c зарядами и указанием торсионных углов. Для начала попробуем провести докинг одного из мономеров сахара (NAG) из прошлого занятия.
Для этого вначала найдем в банке pdb (www.pdb.org) SMILES аннотацию для NAG и сохраним ее в файле nag.smi.
-
Затем с помощью obgen построим 3D-структуру этого сахара в pdb-формате:
obgen nag.smi > nag.mol
babel -imol nag.mol -opdb nag.pdb
В результате был получен файл nag.pdb.
-
С помощью скрипта prepare_ligand4.py из пакета Autodock tools был создан pdbqt-файл лиганда NAG nag.pdbqt:
prepare_ligand4.py -l nag.pdb
-
С помощью того же скрипта был создан pdbqt-файл белка LYSC_HUMAN model5.pdbqt:
prepare_ligand4.py -l model5.pdb
-
Итак, мы получили входные файлы. Теперь создадим файл с параметрами докинга vina.cfg.
Для докинга необходимо указать область структуры белка, в которой будет происходить поиск места для связывания.
Удобно его задать как куб с неким центором. Координаты центра определим из модели комплекса, построенной на прошлом занятии.
Выберем атом сахара, находящийся в центре сайта связывания (например, атом C7B), и извлечемиз текста pdb-файла model5.pdb его координаты (40.394, 40.690, 26.623).
Создадим по этим данным файл vina.cfg.
-
Проведем первый докинг:
vina --config vina.cfg --receptor model5.pdbqt --ligand nag.pdbqt --out nag_prot.pdbqt --log nag_prot.log
В результате докинга были получены файлы nag_prot.pdbqt и nag_prot.log.
-
Просмотрим файл nag_prot.log. Энергии трех лучших расположений и геометрическая разница между ними представлена в таблице:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -5.9
| 0.000
|
2
| -5.6
| 2.004
|
3
| -5.5
| 1.690
|
Файлы nag_prot.pdbqt и model5.pdbqt были загружены в PyMOL.
Все состояния на одной картинке изображены ниже:
Более крупное изображение центра связывания белка представлено ниже:
Такая картинка (со всеми состояниями) показывает, что молекула лиганда свободно перемещается внутри центра связывания белка (возможно, это связано с тем, что это лишь один из трех сахарных остатков реального лиганда).
-
Теперь проведем докинг, рассматривая подвижность некоторых боковых радикалов белка.
Сначала разобьем белок на две части: подвижную и неподвижную.
Для подвижной части выберем 3 аминокислоты, которые мы использовали в прошлом задании для позиционирования лиганда (Trp-82, Asp-120 и Glu-53).
Для создания pdbqt-файла воспользуемся скриптом prepare_flexreceptor4.py:
prepare_flexreceptor4.py -r model5.pdbqt -s GLU1_ASN5_ASP13
В результате были получены файл model5_flex.pdbqt и model5_rigid.pdbqt.
Теперь проведем докинг:
vina --config vina.cfg --receptor model5_rigid.pdbqt --flex model5_flex.pdbqt --ligand nag.pdbqt --out vina_prot_flex.pdbqt --log vina_prot_flex.log
В результате докинга были получены файлы vina_prot_flex.pdbqt и vina_prot_flex.log.
-
Просмотрим файл vina_prot_flex.log. Энергии трех лучших расположений и геометрическая разница между ними представлена в таблице:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -5.1
| 0.000
|
2
| -4.9
| 1.409
|
3
| -4.9
| 1.337
|
Время, затраченное на докинг, куда больше времени, затраченного на первый докинг.
Файлы model5_rigid.pdbqt и vina_prot_flex.pdbqt были загружены в PyMOL.
Все состояния на одной картинке изображены ниже:
Более крупное изображение центра связывания белка представлено ниже:
Как видно, теперь свое положение меняет не только лиганд, но и три аминокислоты белка (правда, из них сильно изменяет положение, пожалуй, только Trp-82; это связано с тем, что другие два остатка взаимодействовали в модели с другими мономерами лиганда).
На мой взгляд, такой подвижный докинг имеет куда больше биологического смысла, чем обычный докинг (ведь молекула белка не является жесткой неподвижной структурой).
"Размах" перемещений лиганда в подвижном докинге куда больше, чем в обычном, что вполне естесственно объясняется подвижностью аминокислотных остатков. В некоторых состояниях очень хорошо видно, как Trp-82 сильно меняет конформацию, контактируя с лигандом.
-
К сожалению, докинг не смог расположить лиганд так, как он располагался в полученной модели.
Однако, стоит отметить, что лучше с задачей справился обычный докинг (а не подвижный!). Более того, только в обычном докинге образовалась водородная связь между лигандом и атомом азота остатка Trp-82 (причем, в двух моделях связь образовалась с нужным атомом кислорода лиганда).
Но по-настоящему хорошо с задачей не справился ни обычный, ни подвижный докинг.
-
Создадим три лиганда, где метильный радикал СH3C(=O)NH группы NAG заменен на OH, NH2 и H.
Для этого были получены файлы nag2.smi, nag3.smi и nag4.smi соответственно со SMILES измененных лигандов.
Затем были получены их pdb-файлы: nag2.pdb, nag3.pdb и nag4.pdb.
Наконец, с помощью скрипта prepare_ligand4.py были получены pdbqt-файлы: nag2.pdbqt, nag3.pdbqt и nag4.pdbqt.
В результате обычного докинга были получены файлы:
для первого лиганда: nag2_prot.log и nag2_prot.pdbqt;
для второго лиганда: nag3_prot.log и nag3_prot.pdbqt;
для третьего лиганда: nag4_prot.log и nag4_prot.pdbqt.
Таблица трех лучших расположений для первого лиганда:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -5.0
| 0.000
|
2
| -5.0
| 1.993
|
3
| -4.9
| 2.072
|
Для второго лиганда:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -5.1
| 0.000
|
2
| -5.0
| 3.014
|
3
| -4.8
| 1.957
|
И для третьего лиганда:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -4.8
| 0.000
|
2
| -4.8
| 2.219
|
3
| -4.8
| 1.338
|
Изображение результата докинга для первого лиганда представлено ниже:
Изображение результата докинга для второго лиганда представлено ниже:
Изображение результата докинга для третьего лиганда представлено ниже:
Интересно, что второй и третий лиганды в нескольких состояниях вышли за пределы центра связывания и оказались в совершенно другой части белка.
-
Проведем докинг с подвижными радикалами для этих трех лигандов.
В результате докинга были получены файлы:
для первого лиганда: vina2_prot_flex.log и vina2_prot_flex.pdbqt;
для второго лиганда: vina3_prot_flex.log и vina3_prot_flex.pdbqt;
для третьего лиганда: vina4_prot_flex.log и vina4_prot_flex.pdbqt.
Таблица трех лучших расположений для первого лиганда:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -3.8
| 0.000
|
2
| -3.8
| 1.231
|
3
| -3.7
| 1.083
|
Для второго лиганда:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -3.9
| 0.000
|
2
| -3.8
| 1.767
|
3
| -3.8
| 1.703
|
И для третьего лиганда:
Расположение
| Энергия (ккал/моль)
| Геометрическая разница с лучшей моделью (rmsd l.b.)
|
1
| -4.3
| 0.000
|
2
| -4.3
| 1.487
|
3
| -4.0
| 1.223
|
Как видно, энергии лучших моделей для всех этих 3 лигандов выше, чем энергии лучших моделей для исходного лиганда.
Изображение результата докинга для первого лиганда представлено ниже:
Изображение результата докинга для второго лиганда представлено ниже:
Изображение результата докинга для третьего лиганда представлено ниже:
Интересно, что в докинге для этих лигандов в большинстве моделей (особенно для первого и второго лиганда) лиганд взаимодействует не с остатков Trp-82 (как в случае исходного лиганда), а с остатком Glu-53. И снова, как и в случае обычного докинга, второй и третий лиганд в подвижном докинге в некоторых моделях покинули сайт связывания белка.
Такая разница в результатах докинга говорит, во-первых, о том, насколько важна каждая группа лиганда (даже такая небольшая, как амидная) для связывания с белком, а во-вторых, о том, насколько специфичен белок в отношении своего лиганда (об этом говорят и энергии взаимодействия с лигандом).