Файл структурных факторов

Таблица Excel: struct_factors.xlsx

С сайта PDB был скачан файл структурных факторов для структуры с PDB ID: 5GWN (5gwn-sf.cif). Данный файл был сохранен в формате Excel и отобраны колонки со следующими значениями: h, k, l, status, F, sigmaF. Общее количество строк (измеренных структурных факторов) в данном файле составляет 111476.

К отобранным пяти колонкам была добавлена еще одна, отражающая силу измеренного сигнала (F/sigma). На основе нее был рассчитан процент "хороших" структурных факторов. "Хорошими" считались те строки, сила сигнала которых превышала 3. Всего их получилось 89365, что составляет 80.17% от общего количества измеренных структурных факторов.

В колонке "status" указано, использовался ли структурный фактор для оптимизации модели. Значение "о" указывает на то, что данный структурный фактор был использован для оптимизации, а "f" — нет. Для данной структуры 103815 (93,13%) факторов были использованы для оптимизации.

В файле со структурными факторами присутствуют также "пропущенные" тройки h,k,l. Тройка точно пропущена, если ее нет среди измеренных структурных факторов,но есть измеренный структурный фактор (h',k', l') с h'>=h, k'>=k, l'>=l. На рис. 1 приведены строки, с такими "пропущенными" тройками — значения h, k, l у них есть, а значения F не измерены. В колонке "status" у таких строк указано "x". Всего таких пропущенных строк в файле — 2187 (1.96%).

Рис. 1. Строки с "пропущенными" тройками h,k,l






© Васильева Елена, 2015