Для работы была выбрана структура фермента 4-оксалокротонат таутомеразы из бактерии Methylibium petroleiphilum PM1 (PDB ID: 4FAZ).
Из сервера PDB также были получены:
Файл Structure factors содержит информацию о всех структурных факторах, полученных в результате эесперимента. Структурные факторы представлены в Excel-файле.
В начале файла представлен хедер. Он хорошо структурирован и содержит много полезной информации. Подробно о нем можно узнать на сайте mmcif.wwpdb.org.
Отдельная строка хедера обознает опрделенный элемент данных (Data Item). Такие строки объеденены в так называемые категории данных (Data Categories), разделенные между собой знаком решётки (#). Последние объединяются в группы категорий (Category Grops).
В данном файле имеется 7 групп категорий:
- audit_group – информация об авторе, дате создания и обновлениях;
- cell_group – описание элементарной ячейки;
- diffrn_group – детали диффракционного эксперимента;
- entry_group – информация о записи;
- exptl_group – содержит детали об условиях эксперимента;
- refln_group – описание деталей измерения рефлексий;
- symmetry_group – информация о симметриях.
Ниже представлен фрагмент этого файла.
loop_
_refln.crystal_id
_refln.wavelength_id
_refln.scale_group_code
_refln.index_h
_refln.index_k
_refln.index_l
_refln.status
_refln.F_meas_au
_refln.F_meas_sigma_au
1 1 1 0 0 2 x ? ?
1 1 1 0 0 4 x ? ?
1 1 1 0 0 6 x ? ?
Элементы данных категории refln, соответствующих строкам, начинающихся с _refln., соответствуют названиям колонок таблицы структурных факторов. Ниже идут строки с измерениями структурных факторов.
refln.crystal_id является указателем на строку _exptl_crystal.id, которая содержит идентификатор списка EXPTL_CRYSTAL, в котором приводится информация об использованном кристалле, например, форма, размер и плотность. В данном файле есть только один такой список, его идентификатр обозначен как "1".
refln.wavelength_id является указателем на строку _diffrn_radiation_wavelength.id, которая содержит идентификатор категории DIFFRN_RADIATION, в котором приводятся описание параметров излучения, ее коллимации и монохроматизации. В данном файле содержится единственная такая категория с идентификатором "1".
refln.scale_group_code является указателем на строку _reflns_scale.group_code, которая содержит идентификатор категории REFLNS_SCALE, в котором записаны детали о величинах структурных факторов. В данном файле также содержится одна единственная такая категория с идентификатором "1".
Три колонки refln.index_h refln.index_k refln.index_l соответственно обозначают целые числа h, k, l.
refln.F_meas_au – F - среднее значение измерений структурного фактора.
refln.F_meas_sigma_au – F_sigma - среднеквадратическое отклонение от среднего.
refln.status обозначает использован ли структурный фактор для оптимизации модели.
Число структурных факторов указано в строке _diffrn_reflns.number и равняется 22831.
Количество структурных факторов, использованных для оптимизации модели: 24323, что соответствует количеству букв "o" в колонке refln.status.
Был произведен поиск неизмеренных структурных факторов*.
*Эти факторы соответствуют явно пропущенным тройкам чисел (h,k, l). Явно пропущенные - это такие, что (1) их нет в файле; (2) хотя бы одна тройка (h',k', l') с h'>=h, k'>=k, l'>=l присутствует в файле.В Таблице 1 приведены примеры неизмеренных структурных факторов.
Таблица 1. Примеры неизмеренных структурных факторов | ||||||||
---|---|---|---|---|---|---|---|---|
crystal_id | wavelength_id | scale_group_code | index_h | index_k | index_l | status | F_meas_au | F_meas_sigma_au |
1 | 1 | 1 | 0 | 0 | 1 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 3 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 5 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 7 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 9 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 11 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 13 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 15 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 17 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 19 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 21 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 23 | ? | ? | |
1 | 1 | 1 | 0 | 0 | 25 | ? | ? |