Учебная страница курса биоинформатики,
год поступления 2011
Как анализировать качество восстановления функции по коэффициентам ряда Фурье
Задание функции
Модель для компьютерного эксперимента. На отрезке [0,30] (ангстремы) расположены две молекулы. Атомы в молекуле связаны ковалентно и находятся на расстоянии 1-1.5 анстрем друг от друга. Молекулы расположены на расстоянии 3-5 ангстрем (водородная связь или гидрофобное взаимодействие между ними). Всего 5-7 атомов (2+3 или 2+3+2; возможны другие варианты). Электронные плотности (ЭП) атомов описываются гауссовой кривой. Максимум ЭП в центре атома приблизительно пропорционален числу электронов в атоме. Берите разные атомы.
Как построить функцию ЭП на отрезке [0,30] для этой модели описано здесь
Задача
Восстановить функцию ЭП по данным о амплитудах и фазах части ее гармоник Фурье. Амплитуды и фазы набора гармоник считаются полученными из экспериментов.
Определения, пояснения
Набор гармоник ряда Фурье называется полным, если известны все гармоники с номерами 0, 1, 2, ...,n.
Разрешением полного набора гармоник называется период гармоники с номером n, т.е. с наибольшим номером. Период гармоники равен расстоянию между соседними максимумами синусоиды; его также называют длиной волны этой гармоники, хотя никакой физической волны нет.
- Зависимость длины волны гармоники от номера:
0 – гармоника есть константа, длины волны нет
1 – длина волны равна длине отрезка T ; в наших заданиях T = 30 (ангстрем)
2 – — " — T/2 (15 ангстрем в заданиях)
3 – — " — T/3 (10 ангстрем в заданиях)
- ...............
n – — " — T/n (30/n ангстрем в заданиях)
Если разрешение полного набора гармоник равно d (ангстрем), то на восстановленной функции неразличимы детали размера меньше чем d/2, имеющиеся на графике исходной функции (проверьте по результатам выполнения задания)
В эксперименте все коэффициенты ряда Фурье получаются с ошибкой. Кроме того, не все до последнего номера n удается измерить.
Для неполного набора данных нет строгого определения разрешения. Кроме разрешения d необходимо сообщить полноту данных — процент гармоник с длиной волны БОЛЬШЕЙ d от максимально возможного, присутствующих в наборе. Для полного набора данных (разрешение d=T/n) полнота равна 100%.
Как сравнить восстановленную функцию с исходной
Отличное восстановление – по графику восстановленной функции можно определить положение максимума всех гауссовых слагаемых функции ("атомов")
Хорошее восстановление – можно угадать положение всех максимумов, зная число слагаемых ("атомов"), хотя на восстановленной функции максимумы от атомов не отличимы от шума
Среднее восстановление – положение каких-то атомов определить по восстановленной функции нельзя, других - можно
Плохое восстановление – положение атомов определить не представляется возможным; можно только предсказать примерный размер "молекулы"
Можете привлечь коллегу: покажите график восстановленной функции, не показывая графика исходной, и попросите определить положение атомов.
План работы
Полные наборы гармоник
Постройте график восстановленной функции по полному набору гармоник с n = 0, 1, .... Найдите n_0 при котором восстановление отличное. Документируйте результат, приведя графики для 3-4х n, включая n_0, и заполнив строчки таблицы 1 в протоколе по теме "Ряд Фурье".
Добавьте шум к амплитудам и фазам при восстановлении по полному набору гармоник 0,...,n_0. Оцените качество восстановления в зависимости от шума, 2-3 результата внесите в протокол (картинки и табл.1)
Неполные наборы гармоник
Удалите одну-две начальные гармоники (номер 0, номера 0-1 и т.п. Документируйте результат в протоколе.
- Удалите 5-10% гармоник из середины набора. Результаты документируйте.
Добавьте одну гармонику с номером, превышающим n_0 на 10. Результаты документируйте.
- Заполните графы "Разрешение" и "Полнота данных" для выбранного разрешения так, как считали бы нужным по результатам компьютерных экспериментов.
- Предложите правило как определять разрешение для набора гармоник Фурье, по которым восстанавливается функция.
- Прокомментируйте полученные результаты.