Файл структурных факторов

1. Скачивание файла

С сайта RCSB можно скачать файл со структурными факторами, которые использовались при определении структуры белка. Так как ранее я работал со структурой крамбина с идентификатором 3NIR, то эта структура и была выбрана для работы. Был скачен файл со структурными факторами:

loop_
_refln.crystal_id
_refln.wavelength_id
_refln.scale_group_code
_refln.index_h
_refln.index_k
_refln.index_l
_refln.status
_refln.F_meas_au
_refln.F_meas_sigma_au
_refln.F_calc
_refln.phase_calc
1 1 1 -46 0 10 o 1.25878 0.815 2.08762 0.0 
1 1 1 -46 0 11 o 1.89417 0.983 3.58371 0.0 
1 1 1 -46 0 12 o 1.18685 0.791 0.28750 0.0 
1 1 1 -46 0 13 o 3.70442 1.055 4.84481 180.0
...
       

Помимо этого, в файле содержится информация о датах публикации структуры, параметрах кристаллической ячейки, длине волны, использовавшейся в эксперименте, и группе симметрии в ячейке. Для удобства работы этот файл был превращен в стандартную таблицу:
Таблица в формате .xls
Таблица в формате .txt с запятыми в нецелых числах
Таблица в формате .txt с точками в нецелых числах

2,3. Анализ файла

Будем считать измерение структурного фактора хорошим, если его значение более, чем в три раза превосходит среднее квадратичное отклонение его измерений. Из 156860 измерений, 127797, то есть 81.47%, оказались хорошими.

В рассмартиваемом файле также есть пропущенные тройки h,k,l. Имеется в виду, что есть такие тройки h,k,l, для которых нет измерений структурных факторов, но есть такие тройки h`,k` и l`, т.ч. h`>=h, k`>=k и l`>=l, для которых в файле есть измеренные структурные факторы. Например, посмотрим на самое начало файла (см. выше). Значения l идут с десяти, хотя в большинстве других серий они идут с нуля, что дает нам первый набор из девяти неизмеренных троек:
-46 0 0-9
Аналогичным образом получим четыре других примера:
-46 5 0-2
-45 4 0,1
-43 14 0,1
0 19 0


© Михаил Молдован, 2013 (Последнее исправление: 27.10.2016)

Valid HTML 4.01 Strict