Список команд, использовавшихся для:

open3dalign

Полный список доступных команд вы можете получитьтут.
open3dalign.sh - для запуска
import type=sdf file=compounds_best_conformer.sdf
align object_list=1
save
Данные команды - это всего лишь ввод данных в программу, выравнивание по первой строке и сохранение полученного результата
Поскольку PyMOL не отреагировал адекватно на полученный файл, пришлось использовать команду
iconv -c -f -utf-8 -t ascii aligned.sdf > aligned_ascii.sdf
Файл после дальнейшей обработки, которую посоветовали, увы, не заработал. Поэтому я опущу эти три команды

QSAR

Список команд:

open3dqsar.sh
Примечательно, что чувствительна к регистру
import type=sdf file=aligned.sdf
import type=dependent file=activity.txt
box
set object_list=60-85 attribute=TEST
set object_list=86-88 attribute=EXCLUDED
calc_field type=VDW force_field=MMFF94 probe_type=CR
cutoff type=max level=5.0 field_list=1
cutoff type=min level=-5.0 field_list=1
zero type=all level=0.05
sdcut level=0.1
nlevel
remove_x_vars type=nlevel

pls
cv type=loo runs=20
predict


Последние три команды дали различные коэффициенты корреляции. Эти команды - пострление регрессионной модели, кросс-валидация и предсказание активности

Полученные результаты:

Команда\PC 0 1 2 3 4 5
PLS 0.0000 0.3284 0.6920 0.8490 0.9242 0.9529
CV -0.0348 0.0683 -0.0509 -0.0368 -0.0829 -0.0006
Predict 0.0000 0.2655 0.3296 0.2353 0.2754 0.2536

Модель, построенная при помощи команды PLS - отличается высокими коэффициентами корреляции, по большей своей части >0.5. Поэтому модель можно было счесть хорошей и проводить кросс-валидацию
Кросс-валидация, увы, дала в основном отрицательную корреляцию (чуть меньше 0) за небольшим исключением.
Предсказание дало в среднем хороший коэффициент корреляции, удерживающийся на уровне 0,25-0,3 +/- 0,02.


Те же команды, но с файлом compounds.sdf - с учетом структурного центра белка-мишени

Команда\PC 0 1 2 3 4 5
PLS 0.0000 0.4847 0.6306 0.7627 0.8063 0.8450
CV -0.0348 0.2851 0.3484 0.4468 0.4968 0.5454
Predict 0.0000 0.3451 0.3226 0.2998 0.3012 0.2693

Коэффициенты корреляции у построенной регрессионной модели чуть более выровнились, оставаясь хорошими
Коэффициенты, полученные после кросс-валидации - стали положительными, также восходящими от 0 до 5, как и в случае регрессионной модели
И, наконец, коэффициенты, полученные в результате предсказания активноти, также выросли, не теряя общей тенденции


Для того, чтобы использовать полученную модель для предсказания активности, был использован следующий набор команд:
set object_list=60-85 attribute=TRAINING
set object_list=86-88 attribute=TEST
pls
predict

           Exp.   Cum. exp.        Exp.   Cum. exp. 
PC var. X % var. X % var. Y % var. Y % SDEC r2 -------------------------------------------------------------------------- 0 0.0000 0.0000 0.0000 0.0000 0.9749 0.0000 1 12.8375 12.8375 44.4004 44.4004 0.7269 0.4440 2 14.5264 27.3638 14.3748 58.7753 0.6260 0.5878 3 6.9607 34.3245 11.2007 69.9760 0.5342 0.6998 4 8.4659 42.7904 5.4939 75.4699 0.4828 0.7547 5 4.7600 47.5503 5.7466 81.2166 0.4225 0.8122

PC    r2(pred)        SDEP
--------------------------
 0      0.0000      6.6604
 1      0.0294      6.5616
 2     -0.0102      6.6942
 3      0.0265      6.5717
 4     -0.0480      6.8183
 5     -0.0950      6.9696
 
--------------------------------------------------------------------------------------------------------------------------------------
    N   ID    Name                                      Actual           1           2           3           4           5    Opt PC n
--------------------------------------------------------------------------------------------------------------------------------------
   86   86    01                                        0.0000      7.0954      7.5090      7.3772      7.6623      7.8822           1
   87   87    44                                        0.0000      6.9300      7.0808      6.9883      7.1990      7.4119           1
   88   88    72                                        0.0000      5.5493      5.2836      5.1285      5.3788      5.3537           3
Используя полученные данные, была создана модель в PyMOL.




Красным окрашено положительное влияние, синим - отрицательное.

Назад