Учебная страница курса биоинформатики,
год поступления 2013
Используйте ваш PDB файл, выбранный согласно требованиям.
Изучите файл структурных факторов
1. Скачайте файл и сохраните в формате Excel
Колонки: h, k, l, status (если есть), F, sigmaF
Файл структурных факторов скачивается из PDB. Для pdb кодов, известных серверу EDS, он должен присутствовать в PDB. Файл так и называется "Structure factors". Он текстовый, в формате mmCIF
2. Рассчитайте процент "хороших" структурных факторов (имеющих силу сигнала больше 3)
Условно, измерение структурного фактора считается хорошим, если его значение в три раза или больше превосходит средне квадратичное нескольких его измерений
В файл Excel добавьте колонку "сила сигнала"
3. Приведите пять примеров "пропущенных" троек h,k,l
Тройка пропущена, если ее нет среди измеренных структурных факторов,но есть измеренный структурный фактор (h',k', l') с h'>=h, k'>=k, l'>=l.
В отчёт включите
- ссылку на файл со структурными факторами (Excel табл) с колонкой сила сигнала
число структурных факторов и процент тех, у которых сила сигнала F/sigma >= 3
- если есть колонка _refln.status, то число структурных факторов, использованных для оптимизации модели (это те, что в колонке стоит "o")
В mmCIF формате
- данные об измеренных структурных факторах начинаются со строки "loop_"
- ниже построчно идут названия колонок
- ниже идут строки с измерениями
- одна строка - один измеренный структурный фактор; в ней обязательно есть следующие данные
- целые числа h, k, l - три колонки _refln.index_h _refln.index_k _refln.index_l
- F - среднее значение измерений структурного фактора _refln.F_meas_au
- F_sigma - ср. кв. отклонение от среднего _refln.F_meas_sigma_au
- могут быть и другие колонки:
- _refln.status - использован ли структурный фактор для оптимизации модели
- _refln.F_calc - структурный фактор, рассчитанный по модели
- _refln.phase_calc - фаза, рассчитанная по модели
- одна строка - один измеренный структурный фактор; в ней обязательно есть следующие данные