Учебный сайт Софроновой Алины
Реконструкция "одномерного белка" по данным РСА

        Целью данного задания было исследовать качество восстановления функции электронной плотности (ЭП) от одной переменной в зависимости от того, какие и сколько гармоник ряда Фурье используется для ее восстановления.

        Для работы были выбраны 2 молекулы: сульфоксид углерода и хлороводород (Рис.1). Обе молекулы полярны и линейны. Атомы в молекулах связаны ковалентной связью и находятся на расстоянии не более 1,5Å. Расстояние между молекулами составляет 3,24Å, что делает возможным образование водородной связи.


Рис.1. Модель двух молекул сульфоксида углерода и хлороводорода для построения функции электронной плотности. На оси подписаны координаты центров соответствующих атомов.

1. Задание функции электронной плотности

       На отрезке [0,30]Å была построена модельная функция ЭП для описанных выше молекул. Электронные плотности атомов описываются гауссовой кривой. Максимум ЭП в центре атома считали равным удвоенному числу электронов в атоме. Функция ЭП была построена при помощи скрипта compile-func.py следующей командой:

python compile-func.py -g 32,3,7.608+12,3,9.108+16,3,10.268+2,3.5,13.428+34,3,14.698

Результат скрипта - текстовый файл func.txt, отражающий зависимость электронной плотности (столбик Y) от координаты (столбик X). Функция ЭП представлена на Рис.2.


Рис.2. Функция ЭП в зависимости от координаты описанных выше молекул на интервале [0,30]Å.

        График ЭП представляет из себя несколько гауссовых кривых с центром в разных точках. Первые 3 пика соответствуют атомам сульфоксида углерода, 4 и 5 пик - хлороводороду.

        Полученную ЭП разложили в ряд Фурье при помощи скрипта func2fourier.py следующей командой:

python func2fourier.py -i func.txt

Амплитуды и фазы 499 гармоник Фурье представлены в выходном файле скрипта func_ft.txt.
2. Восстановление функции ЭП по полным наборам гармоник

       С помощью скрипта fourier-filter.py отбирались нужные нам гармоники. По ним с помощью скрипта fourier2func.py была восстановлена функция электронной плотности по полным наборам гармоник n=0,1,... Затем полученную функцию сравнивали с исходной по следующим критериям:
       Отличное восстановление – по графику восстановленной функции можно определить положение максимума всех гауссовых слагаемых функции ("атомов");
       Хорошее восстановление – можно угадать положение всех максимумов, зная число слагаемых ("атомов"), хотя на восстановленной функции максимумы от атомов не отличимы от шума;
        Среднее восстановление – положение каких-то атомов определить по восстановленной функции нельзя, других - можно;
        Плохое восстановление – положение атомов определить не представляется возможным; можно только предсказать примерный размер "молекулы".
        Отличное восстановление функции ЭП наблюдалось по полному набору гармоник при n=30 (Рис.3Ж) - можно точно определить положения центров атомов, даже водорода. "Идиальное" совпадение с исходной функции наблюдалось при n=46 (Рис.3З). Для набора гармоник n=22,25,29 (Рис.3Г-Е) - хорошее восстановление - не удается восстановить положение атома водорода. Для n=20 и даже n=12 (Рис. 3В,Б) восстановление среднее - положение атома водорода определить не представляется возможным, но положение атома хлора видно четко; точно определяется атом серы, но невозможно определить положения центров атомов углерода и серы. Для набора из 5 гармоник (Рис.3А) восстановление плохое - нельзя определить количество атомов в молекуле, можно лишь определить, что молекул две и примерные размеры этих молекул.


Рис.3. Восстановленная функция ЭП по полным наборам гармоник А)n=5 Б)n=12 В)n=20 Г)n=22 Д)n=25 Е)n=29 Ж)n=30 З)n=46. Черная кривая - исходная функция ЭП, красная - восстановленная.

3. Восстановление функции ЭП по неполным наборам гармоник

        В случае реального эксперимента не всегда удается измерить все амплитуды и фазы ряда Фурье, поэтому мы решили восстановить функцию ЭП по неполному набору гармоник. Для этого мы исключили 0 гармонику (Рис.4А) - т.е. использовали 1-30 гармонику; 0 и 1 гармонику (Рис.4Б) - использовали 2-30 гармонику; 0,1 и 2 гармонику (Рис.4В) - использовали 3-30 гармонику; удалили каждую 10 гармонику (рис.4Г).


Рис.4. Восстановленная функция ЭП по неполным наборам гармоник А)n=1-30 Б)n=2-30 В)n=3-30 Г)n=0-8,10-18,20-28,30 Д)n=0-30,40. Черная кривая - исходная функция ЭП, красная - восстановленная.

        При удалении нулевой гармоники (Рис.4А) функция электронной плотности не изменилась, а только уменьшилась на константу, а именно на нулевую гармонику. При удалении первых двух гармоник график становится косинусоидальной формы, но положения центров атомов (водорода в том числе) по-прежнему можно различить (Рис.4Б). Удаление еще одной гармоники на форму графика особо не влияет (Рис.4В). Удаление каждой десятой гармоники существенно влияет на вид графика - амплитуда шума увеличивается, амплитуда пика атома водорода соответствует амплитуде шума. Добавление одной гармоники с номером 40 слегка уточняет функцию (Рис.4Д).

4. Восстановление функции ЭП по полным наборам гармоник при добавлении шума к амплитудам и фазам

       Добавление шума к амплитудам и/или фазам гармоник осуществлялось при помощи опций -F и -P скрипта func2fourier.py. Добавление шума приводит к тому, что к каждой амплитуде (F) или фазе (P) прибавляется случайное число, распределенное нормально с параметрами: среднее = 0, среднее квадратичное отклонение =0.2*F. По вновь рассчитаным (с учетом шума) 30 гармоникам были рассчитана функция ЭП в случаях добавления 10% и 30% шума к амплитудам (Рис.5А,Б) или фазам (Рис.5В,Г); добавление 10% и 30% шума одновременно к амлитудам и фазам (Рис.5Д,Е).


Рис.5. Восстановленная функция ЭП с добавлением шума к амплитудам (F) и/или фазам (P) А)F=10 Б)F=30 В)P=10 Г)P=30 Д)F=10,P=10 Е)F=30,P=30. Черная кривая - исходная функция ЭП, красная - восстановленная.

        Добавление 10% шума к амплитудам не сильно отраджается на качестве восстановления функции ЭП (Рис.5А) - мы по-прежнему можем определить положения центров всех атомов. 30% шум, добавленный к амплитуде не дает определить положение атома водорода, тяжелые атомы определяются точно. Добавление шума к фазам сильнее влияет на правильность восстановления функции. Так, при добавлении 10% шума мы не может определить атом водорода (Рис.5В), при 30% амплитуда пиков углерода и кислорода приближается к амплитуде шума (Рис.5Г). По функции, восстановленной с добавлением 10% шума и к амплитудам, и к фазам удается определить положение центров всех тяжелый атомов (Рис.5Д). При 30% качество восстановления резко снижается - пик для углерода пропал, шум очень большой амплитуды.

5. Определение разрешения и полноты данных

        Набор гармоник ряда Фурье называется полным, если известны все гармоники с номерами 0, 1, …, n-1, n. Разрешением полного набора гармоник называют период (длину волны) гармоники с номером n. Пусть функция определена на отрезке длиной 30Å. Тогда разрешение полного набора гармоник равно d = 30/nÅ. Чем больше n, тем меньше d, тем выше разрешение, тем лучше восстановление функции. Разрешение неполного набора гармоник можно рассчитывать по той же формуле, но в таком случае необходимо указывать полноту данных - процент гармоник, имеющих длину волны большую, чем гармоника с номером n. Для полного набора гармоник полнота данных равна 100%. В Таблице 1 приведены результаты для всех описанных выше восстановлениях функции:



       Согласно результатам, представленным в Таблице 1, качество восстановления функции определяется полнотой данных и разрешением. Наличие шума также непосредственно влияет на качество восстановления, причем добавление шума к фазам более критично, чем к амплитудам. Положение центра атома водорода из-за малой амплитуды пика легко спутать с шумом, положение тяжелых атомов определить легче.

Вернуться к 7 семестру


© Алина Софронова, 2016
Дата последнего изменения: 04.11.2016