Модельная функция

В данном практикуме мы имитируем восстановление функции электронной плотности белка по полученным в ходе РСА гармоникам Фурье. Для простоты и наглядности используется одномерная модель, имитирующая расположение двух молекул по 3 атома в одномерном пространстве, ограниченном 30 ангстремами. Была взята модель, предоставленная в варианте 1. Модель представляет собой сумму 6 гауссовых функций, описывающихся как

f(x) = \lambda\cdot e^{-\beta^2\cdot (s-\gamma)^2}

Задав параметры для каждой гауссианы в виде 30,2,11+20,2,13+20.0,2,16+30.0,2,21+30.0,2,25+30,2,28, где числа последовательно соответствуют значениям λ, β и γ, и подав эту строчку на вход скрипту compile-func.py можно получить описание поведения функции на интервале [0:30] ангстрем с точностью до 0.01 ангстрема. Полученная функция представлена на рис.1.

Рис. 1 Модельная функция

Расчет амплитуд и фаз сигналов

Далее необходимо смоделировать, какую картину рефлексов даст наша простая система в идеальном слуае. С помощью скрипта func2fourier.py был получен файл с 499 коэффициентами гармоник из разложения функции ЭП в ряд Фурье, в котором для каждой гармоники записаны ее номер, амплитуда и фаза.



Восстановление функции электронной плотности по набору гармоник


По полному набору из 499 гармоник с помощью скрипта fourier2func.py была восстановлена изначальная функция. Полученный график (см. рис. 2) полностью совпадает с исходной функцией.

Назовем качество восстановления "отличным", если по графику восстановленной функции можно определить положение максимума всех гауссиан, т. е. определить положение каждого атома. Определим далее порог числа гармоник, при котором функция восстанавливается отлично. Для этого использовались скрипты fourier-filter.py и fourier2func.py. Использовались наборы гармоник 0-5, 0-10, 0-15, 0-18, 0-19, 0-20. Полученные графики показаны на рис.3А-F.

Рис. 2 Восстановление функции по всем 499 гармоникам
Рис. 3А Восстановление по гармоникам 0-5
Рис. 3B Восстановление по гармоникам 0-10
Рис. 3C Восстановление по гармоникам 0-15
Рис. 3D Восстановление по гармоникам 0-18
Рис. 3E Восстановление по гармоникам 0-19
Рис. 3F Восстановление по гармоникам 0-20

График функции, восстановленный по гармоникам 0-5, дает представление о расположении молекул, но отдельные атомы различить нельзя. Восстановление функции по набору гармоник 0-10 не позволяет различить все отдельные атомы в обеих молекулах, объединяя первые два атома в первой молекуле в одно целое. Восстановление функции по гармоникам 0-15, 0-18 и 0-19 позволяет различить все атомы в молекулах модели, но некоторые пики оказываются немного смещены. При восстановлении по гармоникам 0-20 смещения нет, восстановление отличное. Поэтому было решено принять n_0 равным 20. В дальнейшем для приближения моделирования к эксперименту число используемых гармоник уменьшено до 20.

Можно заметить, что чем меньше расстояние между атомами, тем больше нужно гармоник, чтобы их различить.

Влияние шума
на восстановление функции электронной плотности


Чтобы в какой-то мере приблизить моделирование к реальному эксперименту, к амплитудам и фазам гармоник Фурье был добавлен шум. Операция производилась с помощью скрипта func2fourier.py. Ошибки, добавляемые к амплитуде или фазе, берутся из нормального распределения

\mathcal{N} (0,0.2\cdot f) или \mathcal{N} (0,0.2\cdot p)

где f и p — параметры для генерации шума для амплитуды и фазы соответственно. Всего было получено 9 зашумленных наборов из первых 20 гармоник: A) f = 10; B) f = 30; C) f = 50; D) p = 10; E) p = 30; F) p = 50; G) f = 10, p = 10; H) f = 30, p = 30; I) f = 50, p = 50. Соответствующие им восстановленные функции показаны на рис. 4A-I.

Рис. 4A Восстановление с шумом f = 10
Рис. 4B Восстановление с шумом f = 30
Рис. 4C Восстановление с шумом f = 50
Рис. 4D Восстановление с шумом p = 10
Рис. 4E Восстановление с шумом p = 30
Рис. 4F Восстановление с шумом p = 50
Рис. 4G Восстановление с шумом f = 10, p = 10
Рис. 4H Восстановление с шумом f = 30, p = 30
Рис. 4I Восстановление с шумом f = 50, p = 50

При добавлении шума только по амплитуде (рис. 4 A,B,C) пики атомов четко различимы даже при высоком уровне шума. При добавлении шума по фазе (рис. 4 D,E,F), число атомов различимо, однако несколько пиков могут смещаться на небольшие расстояния относительно исходного положения. Сильный шум по амплитуде и фазе одновременно (рис. 4 H,I) помимо смещения верных пиков добавляет несколько ложных, которые можно принять за дополнительные атомы.


Неполные наборы гармоник


В реальном РСА эксперименте не удается получить всю информацию о полном наборе гармоник, и исследователи работают с неполными наборами гармоник. Для имитации этой особенности мы будем удалять и добавлять гармоники в наборе.

На рис.5 приведен результат удаления гармоники №0 (рис. 5А) и гармоник №0-1 (рис. 5B) из набора 0-20. Удаление гармоники номер 0 изменяет функцию незначительно, только опускает график ниже оси OX. Удаление гармоник 0-1 приводит к появлению синусоидной формы у базовой линии графика.

Если удалить 10% гармоник (2 штуки) из середины набора, мы получим набор гармоник 0-9,12-20. Результат восстановления функции по этому набору приведен на рис.6. При этом пики атомов смещаются со своих изначальных позиций, наблюдается появление фоновых пиков, которые, тем не менее, нельзя спутать с реальным сигналом, даже не зная состав системы заранее.

Рис. 5A Восстановление с исключенной гармоникой номер 0
Рис. 5B Восстановление с исключенными гармониками 0, 1
Рис. 6 Восстановление с исключенными гармониками 10, 11

Если добавить к набору гармонику с номером выше n_0, то картина практически не изменится. Добавление гармоники 30 привело к незначительному уточнению восстановленной функции (см. рис. 7).

Однако в реальной ситуации рассмотренные нами выше факторы — неполнота и шум — сочетаются. Смоделируем более приближенную к реальности ситуацию: для наборов гармоник с исключенными 10 и 11 и для набора с исключенными 6 и 15 добавим шум с параметрами f = 10, p = 10. Результаты представлены на рис. 8 A, B. Атомы немного смещаются относительно исходных позиций, и добавляются незначительные фоновые пики. Возможно, при наличии в модели легких атомов водорода эти пики можно б было принять за них.

Рис. 7 Восстановление с гармониками 1-20 и 30
Рис. 8A Восстановление с исключенными гармониками 10, 11 и шумом f = 10, p = 10
Рис. 8B Восстановление с исключенными гармониками 6, 15 и шумом f = 10, p = 10

Разрешение полученных функций электронной плотности


Разрешение для полного набора гармоник соответствует длине волны гармоники с наибольшим номером в наборе, которая в свою очередь равна расстоянию между соседними максимумами синусоиды и вычисляется как длина рассматриваемого отрезка, деленая на номер гармоники: d_0 = \frac{T}{n}. В рассматриваемом случае Т=30.

Для неполного набора гармоник определение разрешения отличается введением параметра полноты данных. Для некоторого разрешения d полнота — это процент гармоник с разрешением хуже d от максимально возможного. Если задаться полнотой, например, в 95%, то разрешение неполного набора гармоник — это разрешение такой гармоники, что 95% гармоник из набора имеют разрешение хуже d.

Подводя итог, на качество восстановления функции ЭП наиболее значимое воздействие оказывает отсутствие измеренных гармоник из середины набора и шум фаз.

Обобщение результатов практикума приведено в таблице.