На сайте PDB для структуры белка тимин-фосфат-синтазы Bacillus subtilis (PDB ID 1G6C) были получены модель структуры, файл mmCIF (macromolecular Crystallographic Information File) и файл структурных факторов. В файле 1G6C.pdb находится информация об атомах белка, каждому атому соотвествует строчка ATOM. В файле 1g6c-sf.cif находится информация о всех структурных факторах, полученных в результате эксперимента. Ниже представлен фрагмент файла структурных факторов:
_refln.crystal_id |
_refln.wavelength_id |
_refln.scale_group_code |
_refln.index_h |
_refln.index_k |
_refln.index_l |
_refln.status |
_refln.F_meas_au |
_refln.F_meas_sigma_au | 1 1 1 0 0 28 o 99.420 1.481 |
Строчки _refln в данном файле соответствуют столбцам данных, приведенных ниже. В каждой строке указана информация об одном структурном факторе. Количество структурных факторов в файле: 77591. Это можно было бы узнать по записи в файле _diffrn_reflns.number, но в файле структурных факторов для 1G6C она отсутствует, поэтому количество структурных факторов считалось как количество строк в полученном Excel-файле. Количество структурных факторов, использованных для оптимизации модели: 73599, что соответствует количеству букв "o" в колонке _refln.status. Далее был произведен поиск неизмеренных структурных факторов. Эти факторы соответствуют явно пропущенным тройкам чисел (h,k, l). Явно пропущенные - это такие, что:
Отсутствующих троек чисел (h, k, l) в файле не было обнаружено. Результаты поиска представлены в Excel-файле.