Изучение файла структурных факторов 3TW2



Для начала работы скачали файл структурных факторов 3TW2 из PDB в формате mmCIF. Затем сделали файл структрурных факторов в формате Excel.

В файле есть всего 46352(all) структурных фактора, из них 43578(o) было использовано для построения и оптимизации модели. 2320 (f) было использовано для расчета R-free. И 454 (x) не было измеренно. Получается, что "полнота данных" в данном файле (all-x)/all*100%=99.02%. Но как можно увидеть далее это не совсем верно, ведь в этом файле структурных факторов некоторые факторы, которые можно было бы измерить иключены из рассмотрения. Для такиз неизмеренных структурных факторов было дано следующее определение для них: "Не измеренные структурные факторы соответствуют явно пропущенным тройкам чисел (h,k, l). Явно пропущенные - это такие, что (1) их нет в файле; (2) хотя бы одна тройка (h',k', l') с h'>=h, k'>=k, l'>=l Присутствует в файле."

Примерами неизмеренных факторов могут служить те факторы, которые имееют _refln.status == "x", они неизмеренны и соответственно у них нет значений _refln.F_meas_au и _refln.F_meas_sigma_au (там стоят вопросительные знаки). Например:

	h	k	l     status	   F_meas_au		F_meas_sigma_au			F_calc 	phase_calc _refln.fom
	3	27	27	 x		?			?			71.2	188.5		0.00
	5	11	43	 x		?			?			63.4	14.8		0.00
	6	22	34	 x		?			?			17.5	243.8		0.00
	7	33	4	 x		?			?			91.8	208.0		0.00
	7	33	5	 x		?			?			59.8	14.5		0.00
	51	5	14	 x		?			?			66.6	286.0		0.00
	51	7	13	 x		?			?			13.3	356.6		0.00
	51	13	1	 x		?			?			81.5	160.7		0.00
	51	13	2	 x		?			?			37.3	171.5		0.00
	53	9	3	 x		?			?			67.7	282.4		0.00
	53	9	4	 x		?			?			64.6	163.2		0.00
  

Есть и неизверенные структурные факторы не в таком явном виде. Так, во многих местах нет каждого второго, нечетного вектора k, как, например, здесь (здесь и далее указана выдержка из файла):

	h	k	l     status	    F_meas_au F_meas_sigma_au		F_calc 	phase_calc _refln.fom
	0	0	3	o		108.8	18.8			425.2	180.0		0.89
	0	2	0	o		553.2	17.4			2719.3	191.4		0.98
	0	4	0	o		909.2	25.4			2105.9	73.4		0.99
	0	6	0	o		463.2	7.3			897.2	117.0		0.97
									...				
	0	30	0	o		115.6	3.8 			103.9	179.5		0.98
	0	32	0	o		37.3	5.8	 		48.5	228.2		0.76
  

Есть пропуски и четных векторов k:

	h	k	l     status	    F_meas_au F_meas_sigma_au			F_calc 	phase_calc _refln.fom
	1	1	2	o		296.8	9.0				1656.4	103.8		0.90
	1	3	0	o		298.1	5.8				743.8	86.5		0.97
	1	5	0	o		622.8	9.9				1346.8	329.6		0.99
									...			
	1	29	0	o		71.5	3.8				79.2	202.5		0.97
	1	31	0	o		35.1	4.4				32.7	54.3		0.86
	1	33	0	o		38.5	4.1				41.3	277.2		0.86
  

Из этих списков так же видно, что нет структурных факторов с h=1, k=1, l=0 и h=0, k=0, l=0-2. Что не удивительно, ведь это факторы низкого порядка и их невозможно измерить из-за заглушки.

Пропусков h векторов в файле нет.

Значительное количество векторов пропущено для больших порядков (что и обычно):

	h	k	l     status	    F_meas_au F_meas_sigma_au		F_calc 	phase_calc _refln.fom
	53	7	6	o		63.1		20.0		64.8	36.7		0.95
	53	7	7	x		?		?		51.7	188.7		0.00
	53	9	0	o		82.7		22.5		56.5	300.5		0.95
	53	9	1	o		73.2		22.4		53.8	305.2		0.94
	53	9	2	o		56.5		25.9		60.7	21.5		0.93
	53	9	3	x		?		?		67.7	282.4		0.00
	53	9	4	x		?		?		64.6	163.2		0.00
	54	0	0	o		65.1		30.7		58.3	360.0		1.00
	54	6	4	x		?		?		135.1	227.6		0.00
	54	6	5	x		?		?		52.2	18.9		0.00
	54	8	0	x		?		?		51.8	101.9		0.00
	54	8	1	x		?		?		38.7	63.5		0.00
	55	1	0	o		80.3		23.4		90.8	175.6		0.97
	55	1	1	o		66.9		21.4		65.4	337.6		0.95
	55	1	2	o		90.4		25.3		57.0	200.1		0.96
	55	1	3	x		?		?		41.7	285.9		0.00
	55	1	4	x		?		?		76.6	302.6		0.00
	55	3	0	o		71.5		22.0		37.4	336.0		0.92
  


© Tishina Sofia, 2015