Главная | Семестры | Проекты | Заметки | О себе | Полезные ссылки |
Рассмотрим структурные факторы для 1Y44 белка. Файл mmCIF (macromolecular Crystallographic Information File): 1Y44.cif и файл структурных факторов: 1Y44-sf.cif. Кроме того, файл структурных факторов в формате xlsx: structure_factors.xlsx.
В mmCIF формате поищем данные об измеренных структурных факторах. Они начинаются со строки "loop_". Вот как это выглядит в файле:
loop_ _refln.crystal_id _refln.wavelength_id _refln.scale_group_code _refln.index_h _refln.index_k _refln.index_l _refln.status _refln.F_meas_au _refln.F_meas_sigma_au 1 1 1 0 0 -86 h 108.498 108.498 1 1 1 2 0 -86 h 0 0 1 1 1 1 1 -86 h 163.052 51.7750 1 1 1 2 2 -86 h 50.9620 50.9620 1 1 1 1 3 -86 h 0 0 1 1 1 0 4 -86 h 0 0 1 1 1 2 4 -86 h 0 0 1 1 1 1 5 -86 h 0 0 1 1 1 0 6 -86 h 107.956 107.956 1 1 1 2 6 -86 h 0 0 1 1 1 1 7 -86 h 0 0Итак, целые числа h, k, l - три колонки _refln.index_h _refln.index_k _refln.index_l присутствуют.
Название колонки _refln.status есть, она говорит о числе структурных факторов, использованных для оптимизации модели ("о"-если использованы, "h","f","<"-есть еще и такие значения).
Колонки _refln.F_meas_au и _refln.F_meas_sigma_au означают среднее значение измерений структурного фактора и среднее квадратичное оклонение от среднего, соответственно.
Число измеренных структурных факторов поищем следующей командой:
grep "1 1 1" 1y44-sf.cif | wc -l
Получаем 85742.
Поищем число неизмеренных структурных факторов:
Число структурных факторов, использованных для оптимизации модели (это те, что в колонке стоит "o"