Учебная страница курса биоинформатики,
год поступления 2016
Используйте ваш PDB файл, выбранный согласно требованиям.
Изучите файл структурных факторов
1. Скачайте файл и сохраните в формате Excel
Колонки: h, k, l, status (если есть), F, sigmaF
Файл структурных факторов скачивается из PDB. Для pdb кодов, известных серверу EDS, он должен присутствовать в PDB. Файл так и называется "Structure factors". Он текстовый, в формате mmCIF
2. Рассчитайте процент "хороших" структурных факторов (имеющих силу сигнала больше 3)
Условно, измерение структурного фактора считается хорошим, если его значение в три раза или больше превосходит среднее квадратичное (sigmaF) нескольких его измерений
В файл Excel добавьте колонку "сила сигнала"
3. Приведите пять примеров "пропущенных" троек h,k,l
Тройка точно пропущена, если ее нет среди измеренных структурных факторов,но есть измеренный структурный фактор (h',k', l') с h'≥h, k'≥k, l'≥l.
Примечание С.А.С.: на самом деле не точно. Во-первых, всегда есть нижняя граница разрешения (рефлексы, попадающие на заглушку). Во-вторых, бывают исключения, связанные с симметрией кристалла. Например, могут быть приведены значения только для чётных l при данных h и k, это на самом деле не значит, что нечётные пропущены.
В отчёт включите:
- ссылку на файл со структурными факторами (Excel табл) с колонкой "сила сигнала";
число структурных факторов и процент тех, у которых сила сигнала F/sigma ≥ 3;
- если есть колонка _refln.status, то число структурных факторов, использованных для оптимизации модели (это те, что в колонке стоит "o").
В mmCIF формате:
- данные об измеренных структурных факторах начинаются со строки "loop_";
- ниже построчно идут названия колонок;
- ниже идут строки с измерениями:
- одна строка — один измеренный структурный фактор; в ней обязательно есть следующие данные:
целые числа h, k, l — три колонки _refln.index_h _refln.index_k _refln.index_l;
F — среднее значение измерений структурного фактора _refln.F_meas_au ;
F_sigma — ср. кв. отклонение от среднего _refln.F_meas_sigma_au .
- могут быть и другие колонки:
- _refln.status — использован ли структурный фактор для оптимизации модели;
- _refln.F_calc — структурный фактор, рассчитанный по модели;
- _refln.phase_calc — фаза, рассчитанная по модели.
- одна строка — один измеренный структурный фактор; в ней обязательно есть следующие данные: