Учебная страничка Васюткиной Ольги

Файл результатов РСА экспериментов

В данной работе продолжается исследование белка репарации и рекомбинации RadA из археи Methanococcus voltae, идентификатор PDB 3NTU. Из PDB был загружен текстовый файл в формате mmCIF, содержащий информацию о структурных факторах и параметрах кристаллографической ячейки. Параметры ячейки таковы: стороны a,b,c соответственно равны 84.970, 84.970, 104.320 Å, а углы α, β, γ - 90, 90, 120 градусов. Симметрия ячейки принадлежит кристаллографической группе P61.
Этот файл можно импортировать в Excel: скачать

Для всех строк значения колонок _refln.crystal_id, _refln.wavelength_id, _refln.scale_group_code равно 1. Есть столбец "status", в котором обычно содержится информация о том, использовалась ли эта тройка (h,k,l) для оптимизации модели "o" или для контроля "f". Еще в этой колонке может стоять "x" для "пропущенных" троек, для которых нет данных измерений, но есть рассчитанные факторы и фазы. Но в данном файле статус всех троек (h,k,l) равен "o". Видимо, остальные тройки в файл авторы не положили.

Условно, измерение структурного фактора считается хорошим, если его значение в три раза или больше превосходит средне квадратичное нескольких его измерений. В файле Excel есть столбец power_of_signal: значение равно 1, если структурный фактор хороший, и 0, если нет. Всего в файле 34519 структурных фактора. Из них 34054 - хорошие. Процент хороших составляет 98,7%.

Тройка пропущена, если ее нет среди измеренных структурных факторов,но есть измеренный структурный фактор (h',k', l') с h'>=h, k'>=k, l'>=l. Примеры пропущенных троек: (0,1,5), (0,3,7), (1,2,4), (7,29,9), (10,1,43). Больше всего пропущенных троек там, где хотя бы одно из значений h,k,l близко к 0.


Valid HTML 4.01 Transitional