В данном задании проводился компьютерный эксперимент, в котором на примере модельной функции электронной плотности рассматриваются зависимости качества восстановления функции ЭП в зависимости от разного количества и порядка гармоник, от уровня шума в значениях структурных факторов. Была выбрана следующая модель: 2 молекулы, 2 трехатомные молекулы, в каждой молекуле атомы связаны ковалентно и находятся на расстоянии 1-1.5 Å друг от друга. Функция была получена с помощью скрипта compile-func.py (скрипт использует дополнительный модуль fourier, находящийся скрипте fourier.py) с параметрами -g 20,2,5+30,2,8+30.0,2,10+22.0,2,16+21.0,2,23+30,2,27 . Это сумма пяти гауссовских функций с максимумами в точках 5, 8, 10, 16, 23, 27 и с величиной пиков 20, 30, 30, 22, 21, 30.
Рис. 1. Модельная функция электронной плотности |
Далее с помощью скрипта func2fourier.py были рассчитаны коэффициенты Фурье. На выходе получили 499 гармоник. Выходной файл содержит: номер гармоники, амплитуду, фазу.
Набор гармоник ряда Фурье называется полным, если известны все гармоники с номерами 0, 1, 2, ...,n. Разрешением полного набора гармоник называется период гармоники с номером n, т.е. с наибольшим номером. Период гармоники равен расстоянию между соседними максимумами синусоиды; его также называют длиной волны этой гармоники, хотя никакой физической волны нет.
Дальше нужно было определить, сколько первых гармоник достаточно для восстановления функции ЭП с отличным качеством. Критерии качества:
Плохое восстановление – положение атомов определить не представляется возможным; можно только предсказать примерный размер "молекулы"
Среднее восстановление – положение каких-то атомов определить по восстановленной функции нельзя, других - можно
Хорошее восстановление – можно угадать положение всех максимумов, зная число слагаемых ("атомов"), хотя на восстановленной функции максимумы от атомов не отличимы от шума
Отличное восстановление – по графику восстановленной функции можно определить положение максимума всех гауссовых слагаемых функции ("атомов")
C помощью скрипта fourier-filter.py я отобрала нужное число гармоник.
Таблица 1. Восстановление функции по неполному набору гармоник
Восстановление функции по неполному набору гармоник (0-5). Восстановление плохое | Восстановление функции по неполному набору гармоник (0-10). Восстановление нормальное |
Восстановление функции по неполному набору гармоник (0-15). Восстановление хорошее | Восстановление функции по неполному набору гармоник (0-20). Восстановление хорошее |
Восстановление функции по неполному набору гармоник (0-25). Восстановление отличное | Восстановление функции по неполному набору гармоник (0-30). Восстановление отличное |
Основываясь на данных таблицы, при восстановлении функции по гармоникам 0-25 качество отличное, поэтому минимальное число гармоник, при котором у функции отличное восстановление - 25.
При восстановлении функции по первым 25 гармоникам было добавлено 10%, 15% и 25% шума к амплитудам и фазам отдельно. Поскольку изначальные данные получены для идеальной модели, а реальные данные часто зашумлены и поэтому необходимо проверить влияние шума.
Таблица 2. Восстановление функции по неполному набору гармоник при добавлении шума к амплитуде
Восстановление функции по неполному набору гармоник (0-25)при добавлении 10% шума к амплитуде. | Восстановление функции по неполному набору гармоник (0-25)при добавлении 20% шума к амплитуде. |
Восстановление функции по неполному набору гармоник (0-25)при добавлении 15% шума к амплитуде. |
Таблица 3. Восстановление функции по неполному набору гармоник при добавлении шума к фазам
Восстановление функции по неполному набору гармоник (0-25)при добавлении 10% шума к фазам | Восстановление функции по неполному набору гармоник (0-25)при добавлении 15% шума к фазам |
Восстановление функции по неполному набору гармоник (0-25)при добавлении 25% шума к фазам | Восстановление функции по неполному набору гармоник (0-25)при добавлении 10% шума к амплитудам и фазам одновременно |
Восстановление функции по неполному набору гармоник (0-25)при добавлении 25% шума к амплитудам и фазам одновременно |
Удалялась нулевая гармоника - создавались неполные наборы гармоник. Затем были удалены гармоники 1-, затем произвольные 4 и была добавлена произвольная 34.
Таблица 4. Восстановление функции по неполному набору гармоник при удалении и добавлении гармоник
Восстановление функции по неполному набору гармоник (1-25) | Восстановление функции по неполному набору гармоник (4-25) |
Восстановление функции по неполному набору гармоник (0-17, 23-25) | Восстановление функции по неполному набору гармоник (0-25, 33) |
Следует обратить внимание, что наибольшее влияние на восстановление функции электронной плотности оказывает шум в значениях фаз и пропуски в середине набора гармоник. Обобщение полученных данных находится в Таблице 5. Разрешение рассчитывалось как d=T/n, то есть если гармоник 499, то 30/499= 0,06 А. Для неполного набора данных нет строгого определения разрешения. Полнота данных — еще один необходимый параметр - это процент гармоник с длиной волны большей d от максимально возможного, присутствующих в наборе.
© Yuliia Preobrazhenskaya, 2015-2016