Изучение файла структурных факторов


На сайте PDB для структуры белка тимин-фосфат-синтазы Bacillus subtilis (PDB ID 1G6C) были получены модель структуры, файл mmCIF (macromolecular Crystallographic Information File) и файл структурных факторов. В файле 1G6C.pdb находится информация об атомах белка, каждому атому соотвествует строчка ATOM. В файле 1g6c-sf.cif находится информация о всех структурных факторах, полученных в результате эксперимента. Ниже представлен фрагмент файла структурных факторов:

_refln.crystal_id
_refln.wavelength_id
_refln.scale_group_code
_refln.index_h
_refln.index_k
_refln.index_l
_refln.status
_refln.F_meas_au
_refln.F_meas_sigma_au
1 1 1    0    0    28 o   99.420  1.481

Строчки _refln в данном файле соответствуют столбцам данных, приведенных ниже. В каждой строке указана информация об одном структурном факторе. Количество структурных факторов в файле: 77591. Это можно было бы узнать по записи в файле _diffrn_reflns.number, но в файле структурных факторов для 1G6C она отсутствует, поэтому количество структурных факторов считалось как количество строк в полученном Excel-файле. Количество структурных факторов, использованных для оптимизации модели: 73599, что соответствует количеству букв "o" в колонке _refln.status. Далее был произведен поиск неизмеренных структурных факторов. Эти факторы соответствуют явно пропущенным тройкам чисел (h,k, l). Явно пропущенные - это такие, что:

Отсутствующих троек чисел (h, k, l) в файле не было обнаружено. Результаты поиска представлены в Excel-файле.

© Novikova Maria, 2015
Последнее обновление: 04.11.2015