Список команд, использовавшихся для:
Полный список доступных команд вы можете получитьтут.
open3dalign.sh - для запуска
import type=sdf file=compounds_best_conformer.sdf
align object_list=1
save
Данные команды - это всего лишь ввод данных в программу, выравнивание по первой строке и сохранение полученного результата
Поскольку PyMOL не отреагировал адекватно на полученный файл, пришлось использовать команду
iconv -c -f -utf-8 -t ascii aligned.sdf > aligned_ascii.sdf
Файл после дальнейшей обработки, которую посоветовали, увы, не заработал. Поэтому я опущу эти три команды
Список команд:
open3dqsar.shpls
cv type=loo runs=20
predict
Последние три команды дали различные коэффициенты корреляции. Эти команды - пострление регрессионной модели, кросс-валидация и предсказание активности
Полученные результаты:
Команда\PC | 0 | 1 | 2 | 3 | 4 | 5 |
PLS | 0.0000 | 0.3284 | 0.6920 | 0.8490 | 0.9242 | 0.9529 |
CV | -0.0348 | 0.0683 | -0.0509 | -0.0368 | -0.0829 | -0.0006 |
Predict | 0.0000 | 0.2655 | 0.3296 | 0.2353 | 0.2754 | 0.2536 |
Модель, построенная при помощи команды PLS - отличается высокими коэффициентами корреляции, по большей своей части >0.5. Поэтому модель можно было счесть хорошей и проводить кросс-валидацию
Кросс-валидация, увы, дала в основном отрицательную корреляцию (чуть меньше 0) за небольшим исключением.
Предсказание дало в среднем хороший коэффициент корреляции, удерживающийся на уровне 0,25-0,3 +/- 0,02.
Команда\PC | 0 | 1 | 2 | 3 | 4 | 5 |
PLS | 0.0000 | 0.4847 | 0.6306 | 0.7627 | 0.8063 | 0.8450 |
CV | -0.0348 | 0.2851 | 0.3484 | 0.4468 | 0.4968 | 0.5454 |
Predict | 0.0000 | 0.3451 | 0.3226 | 0.2998 | 0.3012 | 0.2693 |
Коэффициенты корреляции у построенной регрессионной модели чуть более выровнились, оставаясь хорошими
Коэффициенты, полученные после кросс-валидации - стали положительными, также восходящими от 0 до 5, как и в случае регрессионной модели
И, наконец, коэффициенты, полученные в результате предсказания активноти, также выросли, не теряя общей тенденции
Для того, чтобы использовать полученную модель для предсказания активности, был использован следующий набор команд:
set object_list=60-85 attribute=TRAINING
set object_list=86-88 attribute=TEST
pls
predict
Exp. Cum. exp. Exp. Cum. exp.
PC var. X % var. X % var. Y % var. Y % SDEC r2 -------------------------------------------------------------------------- 0 0.0000 0.0000 0.0000 0.0000 0.9749 0.0000 1 12.8375 12.8375 44.4004 44.4004 0.7269 0.4440 2 14.5264 27.3638 14.3748 58.7753 0.6260 0.5878 3 6.9607 34.3245 11.2007 69.9760 0.5342 0.6998 4 8.4659 42.7904 5.4939 75.4699 0.4828 0.7547 5 4.7600 47.5503 5.7466 81.2166 0.4225 0.8122
PC r2(pred) SDEP -------------------------- 0 0.0000 6.6604 1 0.0294 6.5616 2 -0.0102 6.6942 3 0.0265 6.5717 4 -0.0480 6.8183 5 -0.0950 6.9696 -------------------------------------------------------------------------------------------------------------------------------------- N ID Name Actual 1 2 3 4 5 Opt PC n -------------------------------------------------------------------------------------------------------------------------------------- 86 86 01 0.0000 7.0954 7.5090 7.3772 7.6623 7.8822 1 87 87 44 0.0000 6.9300 7.0808 6.9883 7.1990 7.4119 1 88 88 72 0.0000 5.5493 5.2836 5.1285 5.3788 5.3537 3