Для работы была выбрана структура фермента 4-оксалокротонат таутомеразы из бактерии Methylibium petroleiphilum PM1 (PDB ID: 4FAZ).

Из сервера PDB также были получены:

Файл Structure factors содержит информацию о всех структурных факторах, полученных в результате эесперимента. Структурные факторы представлены в Excel-файле.

В начале файла представлен хедер. Он хорошо структурирован и содержит много полезной информации. Подробно о нем можно узнать на сайте mmcif.wwpdb.org.

Отдельная строка хедера обознает опрделенный элемент данных (Data Item). Такие строки объеденены в так называемые категории данных (Data Categories), разделенные между собой знаком решётки (#). Последние объединяются в группы категорий (Category Grops).

В данном файле имеется 7 групп категорий:

  • audit_group – информация об авторе, дате создания и обновлениях;
  • cell_group – описание элементарной ячейки;
  • diffrn_group – детали диффракционного эксперимента;
  • entry_group – информация о записи;
  • exptl_group – содержит детали об условиях эксперимента;
  • refln_group – описание деталей измерения рефлексий;
  • symmetry_group – информация о симметриях.

Ниже представлен фрагмент этого файла.

loop_ _refln.crystal_id
_refln.wavelength_id
_refln.scale_group_code
_refln.index_h
_refln.index_k
_refln.index_l
_refln.status
_refln.F_meas_au
_refln.F_meas_sigma_au
1 1 1 0 0 2 x ? ?
1 1 1 0 0 4 x ? ?
1 1 1 0 0 6 x ? ?

Элементы данных категории refln, соответствующих строкам, начинающихся с _refln., соответствуют названиям колонок таблицы структурных факторов. Ниже идут строки с измерениями структурных факторов.

refln.crystal_id является указателем на строку _exptl_crystal.id, которая содержит идентификатор списка EXPTL_CRYSTAL, в котором приводится информация об использованном кристалле, например, форма, размер и плотность. В данном файле есть только один такой список, его идентификатр обозначен как "1".

refln.wavelength_id является указателем на строку _diffrn_radiation_wavelength.id, которая содержит идентификатор категории DIFFRN_RADIATION, в котором приводятся описание параметров излучения, ее коллимации и монохроматизации. В данном файле содержится единственная такая категория с идентификатором "1".

refln.scale_group_code является указателем на строку _reflns_scale.group_code, которая содержит идентификатор категории REFLNS_SCALE, в котором записаны детали о величинах структурных факторов. В данном файле также содержится одна единственная такая категория с идентификатором "1".

Три колонки refln.index_h refln.index_k refln.index_l соответственно обозначают целые числа h, k, l.

refln.F_meas_au – F - среднее значение измерений структурного фактора.

refln.F_meas_sigma_au – F_sigma - среднеквадратическое отклонение от среднего.

refln.status обозначает использован ли структурный фактор для оптимизации модели.


Число структурных факторов указано в строке _diffrn_reflns.number и равняется 22831.

Количество структурных факторов, использованных для оптимизации модели: 24323, что соответствует количеству букв "o" в колонке refln.status.

Был произведен поиск неизмеренных структурных факторов*.

*Эти факторы соответствуют явно пропущенным тройкам чисел (h,k, l). Явно пропущенные - это такие, что (1) их нет в файле; (2) хотя бы одна тройка (h',k', l') с h'>=h, k'>=k, l'>=l присутствует в файле.

В Таблице 1 приведены примеры неизмеренных структурных факторов.

Таблица 1. Примеры неизмеренных структурных факторов
crystal_id wavelength_id scale_group_code index_h index_k index_l status F_meas_au F_meas_sigma_au
1 1 1 0 0 1 ? ?
1 1 1 0 0 3 ? ?
1 1 1 0 0 5 ? ?
1 1 1 0 0 7 ? ?
1 1 1 0 0 9 ? ?
1 1 1 0 0 11 ? ?
1 1 1 0 0 13 ? ?
1 1 1 0 0 15 ? ?
1 1 1 0 0 17 ? ?
1 1 1 0 0 19 ? ?
1 1 1 0 0 21 ? ?
1 1 1 0 0 23 ? ?
1 1 1 0 0 25 ? ?