Восстановление структуры

В работе использовался модуль fourier.py и базирующиеся на нём скрипты Python, расположенные здесь.

I

Моделирование одномерной функции электронной плотности. Моделирование функции ЭП проводилось в одномерной элементарной ячейке на отрезке [0, 30] Å. Модель представляла собой две молекулы (из 2 и 3 атомов соответственно), расположенные на расстоянии ~5 Å. Команда для генерации функции: python compile-func.py -g 10, 3, 8+7, 3.5, 9.2+25, 3, 13+33, 3.5, 14.5+15, 3, 15.5. Аргумент -g содержит в себе параметры пяти Гауссианов в формате lambda1, beta1, gamma1+lambda2, beta2, gamma2+... . Таким образом, координаты максимумов сгенерированной функции (см. график снизу):
        •  по оси х: 8, 9.2, 13, 14.5, 15.5;
        •  по оси у: 10, 7, 25, 33, 15.

II

Полный набор гармоник. Сгенерированная функция была разложена в ряд Фурье при помощи func2fourier.py. Результат представляет собой разложение на 499 гармоник. Далее для определения минимального числа гармоник, идеально восстанавливающих функцию ЭП, использовались скрипты: 1. fourier-filter.py для отсечения указанного подмножества гармоник из полного набора, где их 499; 2. fourier2func.py для восстановления функции по гармоникам. Восстановление по первым N гармоникам для N < 100 представлено в анимированом виде ниже.

Плохое качество восстановления: при использовании ~10 гармоник появляется возможность определить примерное местоположение двух отдельных молекул.

Среднее и хорошее качество восстановления: при использовании порядка 20 гармоник становятся различимы отдельные атомы в составе молекул. Это восстановление можно назвать хорошим, но оно имеет искаженные амплитуды пиков (восстановленные ниже исходных), а также некоторые шумовые пики, по размерам сравнимые с «настоящими». С увеличением числа гармоник (в районе 30 — 40) такого шума становится все меньше и меньше, однако он все еще существенен.

Отличное качество восстановления: при использовании первых 47 гармоник наблюдаемые пики по высоте почти совпадают с оригинальными. Уровень же шума пренебрежимо низок. В дальнейшей работе под полным набором гармоник, однозначно восстанавливающим функцию ЭП, подразумевается набор 0 — 47 (N0 = 47).

Далее исследовалось влияние добавления шума к амплитудам (F) и фазам (P) на восстановление ЭП по набору 0 — 47. В ходе работы использовался скрипт func2fourier и, в частности, перебирались значения для его параметров F и P, которые отвечают за процент гауссова зашумления в соответствующих значениях (амплитудах или фазах). Результаты приведены на картинках ниже. Уровни зашумления, которые были рассмотрены: 0%, 10% и 25% для амплитуд, для фаз и для обоих параметров одновременно.

Увеличение уровня шума по амплитуде, как это хорошо прослеживается в случаях с P = 0, приводит к зашумлению, колеблющемуся вокруг оси х, не сравнимому по величине с амплитудами реальных пиков. Последние при этом восстанавливаются достаточно точно, искажения общего вида функции ЭП не происходит.

Увеличение же уровня шума, вносимого в фазы, приводит к появлению шума, который уже можно принять за истинные пики. Рассмотрев различные уровни шума, вносимого в фазы и амплитуды одновременно, можно заключить, что шум по фазе сильнее влияет на качество восстановления, ухудшая его.

III

Неполные наборы гармоник. Из полного набора в 47 гармоник выбирались определенные подмножества, после чего проводилось восстановление.

  1. Удаление начальных гармоник (1-47; 2-47);
  2. Удаление других гармоник:
    • разное количество удаленных в середине (0-20, 28-47; 0-22, 26-47);
    • оставление пятёрок гармоник из начала, середины и конца (0-5, 22-27, 42-47);
    • оставление только срединной пятерки (22-27);
  3. Добавление гармоники N0+10 (0-47, 57).

Какие выводы можно сделать из приведенных выше восстановлений по сабсетам? Удаление первой гармоники, являющейся константой, ожидаемо приводит к сдвигу восстановленной функции относительно исходной по оси Оу. Без двух первых гармоник в восстановленной функции появляется, однако он не препятствует выделению пиков с достаточной точностью. Удаление гармоник из середины гораздо сильнее влияет на качество восстановления. Отдельные пики не всегда можно выделить, порой шум достигает тех же величин и может быть ошибочно принят за истинный сигнал. Также наблюдается смещение по оси х координат пиков. Очевидно, удаление большего числа гармоник существеннее искажает вид восстановленной функции. В случае же, когда гармоники брались из начала, середины и конца, положения пиков получаются более точными, но присутствует и сильный шум, сравнимый по величине с настоящими пиками. Восстановление по пяти гармоникам только из середины дает неприемлемо плохое качество: не выделяется ни положение молекул, ни тем более атомов. Добавление же 57-ой гармоники к полному набору не внесло существенных изменений, и качество восстановления осталось идеальным. Более детальное описание находок можно прочитать в прикреплённом файле.