Для выполнения практикума была выбрана структура 3D30, работа с которой велась на первом курсе. Указанно разрешение структуры 1.9 Å при полноте данных 99.7% в интервале от 1.90 Å до 45.40 Å.
Из PDB был получен файл со структурными факторами 3d30-sf.cif. Из него была получена таблица со структурными факторами 3d30-sf.xlsx
Число структурных факторов в файле указано в следующем виде:
_reflns.number_all | 38980 |
_reflns.number_obs | 38922 |
Определение числа неизмеренных структурных факторов.
В задании дано следующее определение для неизмеренных структуных факторов: "Не измеренные структурные факторы соответствуют явно пропущенным тройкам чисел (h,k, l). Явно пропущенные - это такие, что (1) их нет в файле; (2) хотя бы одна тройка (h',k', l') с h'>=h, k'>=k, l'>=l Присутствует в файле."
Однако в таблице структурных факторов для структуры 3D30 встречаются строчки со следующим содержанием:
_refln.index_h | _refln.index_k | _refln.index_l | _refln.status | _refln.F_meas_au | _refln.F_meas_sigma_au | _refln.F_calc | _refln.phase_calc | _refln.fom |
0 | 2 | 4 | x | ? | ? | 11620.4 | 180 | 0 |
0 | 3 | 3 | x | ? | ? | 21300.1 | 0 | 0 |
0 | 4 | 0 | x | ? | ? | 44782.1 | 0 | 0 |
0 | 4 | 2 | x | ? | ? | 9762.1 | 180 | 0 |
0 | 5 | 11 | x | ? | ? | 7806.4 | 180 | 0 |
1 | 66 | 37 | x | ? | ? | 81.9 | 81.9 | 0 |
25 | 50 | 51 | x | ? | ? | 136.3 | 218.8 | 0 |
25 | 51 | 50 | x | ? | ? | 67.9 | 270.2 | 0 |
26 | 45 | 55 | x | ? | ? | 120.9 | 95.8 | 0 |
30 | 39 | 39 | x | ? | ? | 114.8 | 5.2 | 0 |
Кроме того, если взять любой произвольный участок таблицы, можно увидеть, что все значения для вектора l, идут через один:
_refln.index_h | _refln.index_k | _refln.index_l | _refln.status | _refln.F_meas_au | _refln.F_meas_sigma_au | _refln.F_calc | _refln.phase_calc | _refln.fom |
0 | 3 | 53 | o | 151.8 | 44.0 | 54.3 | 180.0 | 0.42 |
0 | 3 | 55 | o | 143.9 | 48.1 | 218.4 | 180.0 | 0.92 |
0 | 3 | 57 | o | 130.6 | 49.2 | 21.0 | 0.0 | 0.23 |
0 | 3 | 59 | o | 107.0 | 45.8 | 146.1 | 180.0 | 0.69 |
По данному определению получается, что каждый второй фактор не измерен, хотя указано, что всего возможных факторов 38980, а измерено 38922. Попробуем разобраться.
Всего в колонке _refln.status встречается три значения: o, f, x. Если я правильно поняла, то f – это число структурных факторов, использованных для построения модели. Итак, число факторов, соответствующих этим значениям:
Число структурных факторов, использованных для оптимизации модели (o) | 36971 |
Число структурных факторов, использованных для построения модели (f) | 1951 |
Число неизмеренных структурных факторов (x) | 58 |
Всего | 38980 |
Получается, что только факторы со статусом x считаются неизмеренными, и их немного по сравнению с общим числом факторов. «Полнота данных» = (38922/38980)*100% = 99.85%.