Структурные факторы

Главная Семестры Проекты Заметки О себе Полезные ссылки


Рассмотрим структурные факторы для 1Y44 белка. Файл mmCIF (macromolecular Crystallographic Information File): 1Y44.cif и файл структурных факторов: 1Y44-sf.cif. Кроме того, файл структурных факторов в формате xlsx: structure_factors.xlsx.

В mmCIF формате поищем данные об измеренных структурных факторах. Они начинаются со строки "loop_". Вот как это выглядит в файле:
loop_
_refln.crystal_id
_refln.wavelength_id
_refln.scale_group_code
_refln.index_h
_refln.index_k
_refln.index_l
_refln.status
_refln.F_meas_au
_refln.F_meas_sigma_au
1 1 1    0    0  -86 h  108.498 108.498 
1 1 1    2    0  -86 h        0      0 
1 1 1    1    1  -86 h  163.052 51.7750 
1 1 1    2    2  -86 h  50.9620 50.9620 
1 1 1    1    3  -86 h        0      0 
1 1 1    0    4  -86 h        0      0 
1 1 1    2    4  -86 h        0      0 
1 1 1    1    5  -86 h        0      0 
1 1 1    0    6  -86 h  107.956 107.956 
1 1 1    2    6  -86 h        0      0 
1 1 1    1    7  -86 h        0      0 

Итак, целые числа h, k, l - три колонки _refln.index_h _refln.index_k _refln.index_l присутствуют.

Название колонки _refln.status есть, она говорит о числе структурных факторов, использованных для оптимизации модели ("о"-если использованы, "h","f","<"-есть еще и такие значения).

Колонки _refln.F_meas_au и _refln.F_meas_sigma_au означают среднее значение измерений структурного фактора и среднее квадратичное оклонение от среднего, соответственно.

Число измеренных структурных факторов поищем следующей командой:

grep "1 1 1" 1y44-sf.cif | wc -l

Получаем 85742.

Поищем число неизмеренных структурных факторов:



Число структурных факторов, использованных для оптимизации модели (это те, что в колонке стоит "o"