ProDy. Синтез Фурье

В данном практикуме с помощью программы Python изучали B-фактор структур, полученных рентгеноструктурным анализом, и восстанавливали электронную плотность по "экспериментальным данным".

Задание 1. Prody и B-факторы. Аминокислотные остатки с наименьшим и наибольшим средним B-фактором.

Пакет данных Prody программы Python для изучения структурной динамики белков позволяет детально изучить значения B-фактора для каждого аминокислотного остатка. С его помощью были выявлены аминокислотные остатки с наименьшим и наибольшим средним по атомам B-фактором в структуре 7BK3. Наименьшее среднее значение равное 15.07 оказалось у глицина 195, тогда как наибольшее 107.43 - у аланина 19. Разброс по атомам у обоих аминокислотных остатков небольшой: у первого он составляет 2.3 со стандартным отклонением 0.87, у второго - 15.22 и 5.16 соответственно. После визуализации расположения этих остатков в белке стало понятно, почему именно у них оказались пороговые значения B-фактора. На рисунке 1 видно, что глицин находится в центральной хорошо структурированной части белка, из-за чего положение атомов довольно точно можно определить и В-фактор этой части белка низкий, а наименьшее значение у глицина, так как у этого аминокислотного остатка боковым радикалом является водород, который не влияет на значение В-фактора. У аланина полностью противоположная ситуация: он расположен в петле, в такой части белка, которая не структурирована и все его окружение имеет высокие значения B-фактора, так как имеют больше свободы в перемещениях и вращениях вокруг связей. А за счет того, что боковой радикал у остатка аланин - это небольшая метильная группа, его В-фактор оказался максимальным.

Структура 7BK3
Рисунок 1. Структура 7BK3, покрашенная в зависимости от значения В-фактора, с отмеченными аминокислотными остатками, имеющими наибольшую (Ala-19) и наименьшую величину (Gly-195) В-фактора.

Задание 2. Prody и B-факторы. Зависимость B-фактора от расстояния до центра белка.

В данном задании рассматривалась зависимость B-фактора от расстояния до центра белка. Для этого вычислялся центр центр масс всего белка и его аминокислотных остатков, потом измерялось расстояние от центра масс белка до центра масс каждого из аминокислотных остатков. На рисунке 2 показан график, иллюстрирующий зависимость полученного расстояния от среднего значения B-фактора аминокислотного остатка. В целом прослеживается тенденция, что чем дальше от центра масс белка расположен аминокислотный остаток, тем выше его В-фактор, что логично, так как остатки на периферии больше контактируют с молекулами растворителя, имеют больше свободы, отчего более подвижны и их местоположение становится неопределеннее. Но выделяются также точки, имеющие очень высокий B-фактор (от 80 и больше), но находящиеся на расстоянии 13-18 ангстрем от центра масс. Остатком с максимальным B-фактором является аланин-19, а остальные точки соответствуют остаткам, его окружающим (Gly-18, Tyr-20, Gly-21 и Glu-22), и находятся на той же петле либо на рядом расположенном бета-листе. Хотя эти остатки не расположены на периферии, но они являются зоной перехода между участком белка с альфа-спиралями и участком с бета-листами, из-за чего более подвижны, чем все остальные аминокислотные остатки.

Зависимость B-фактора от расстояния до центра белка
Рисунок 2. График зависимости B-фактора от расстояния до центра белка.

Задание 3. Восстановление функции электронной плотности по экспериментальным данным.

Для лучшего понимания процесса восстановления электронной плотности по экспериментальным данным был проведен небольшой эксперимент. Вначале была сгенерирована электронная плотность на отрезке длиной в 30 ангстрем, имитирующая структуру, состоящую из двух молекул, каждая из которых состоит из трех атомов. Электронная плотность каждого атома описывается гауссовой кривой, высота пика которой соответствует количеству электронов этого атома. Электронная плотность была синтезирована с помощью скрипта compile-func.py с параметрами -g 3,3.5,6+25,3,7+3,3.5,8+21,3,12.5+32,2.5,14+3,3,15.25 (каждое из слагаемых отвечает за электронную плотность одного атома, первое значение задает высоту колокола, если высота колокола равна 3 А, то это электронная плотность атома водорода; второе значение - ширину колокола, причем значение 3 соответствует 1 ангстрему; а третье - местоположение на отрезке 30 ангстрем).

График электронной плотности
Рисунок 3. Функция электронной плотности

Далее из электронной плотности можно рассчитать амплитуды и фазы путем разложения ее в ряд Фурье. Из полученных коэффициентов можно восстанавить электронную плотность. Качество ее восстановления зависит от количества гармоник в ряде Фурье, что демонстрируется на рисунке 4. При небольшом количестве гармоник электронная плотность восстанавливается очень плохо, видно только общее расположение молекул. При восстановлении с помощью 20 гармоник на электронной плотности уже точно угадывается расположение всех атомов, кроме водорода. Отличное восстановление достигается при применении 37 гармоник, и дальнейшее увеличение их числа не оказывает практически никакого влияния, лишь только уменьшает и так незначительный уровень шума.

Электронная плотность Электронная плотность Электронная плотность Электронная плотность Электронная плотность Электронная плотность
Рисунок 4. Восстановление электронной плотности по полному набору гармоник 0-5, 0-10, 0-20, 0-30, 0-37, 0-45.

Так как в реальном эксперименте не удается абсолютно точно определить интенсивность и фазы сигнала, то и в нашем эксперименте мы решили изучить влияние шума на восстановление электронной плотности при полном наборе гармоник (0-37). На рисунке 5 показано восстановление электронной плотности при добавлении шума к амплитудам (уровень шум составлял 5, 25 и 60%). При уровне шума 5% восстановление электронной плотности отличное, при 25% уже можно ошибиться в расположениях водородов, но в целом все остальные пики хорошо детектируются. При 60% уровне шума возникает полная неопределенность в положении атомов водорода.

Электронная плотность Электронная плотность Электронная плотность
Рисунок 5. Восстановление электронной плотности при уровне шума амплитуд 5, 25 и 60%.

По рисунку 6 можно сделать вывод о том, что шум при расчете фаз хуже влияет на восстановление электронной плотности, чем неточность в расчете амплитуд, так как электронная плотность хуже восстанавливается и при 60% уровне шума сложно отметить положение даже тяжелых атомов. При этом обычно именно решение фазовой проблемы становится самым трудным шагом при восстановлении структуры при рентгеноструктурном анализе, и их неточное определение может сильно исказить результат.

Электронная плотность Электронная плотность Электронная плотность
Рисунок 6. Восстановление электронной плотности при уровне шума фаз 5, 25 и 60%.

При добавлении шума как к амплитудам, так и к фазам отличное восстановление не наблюдается даже при 5%, так как возникает неопределенность в положении водородов, а при 60% восстановление вообще невозможно, так как неотличимы даже атомы тяжелых элементов.

Электронная плотность Электронная плотность Электронная плотность
Рисунок 7. Восстановление электронной плотности при уровне шума аплитуд и фаз 5, 25 и 60%.

Искажает результат и тот факт, что часто не все коэффициенты ряда Фурье получается вычислить, из-за чего восстановление происходит по неполному набору гармонику. Чтобы смоделировать этот случай, при восстановлении не использовались первые две гармоники. Из-за этого сдвинулась вниз нулевая линия практически на всем отрезке, но при этом остались различимы все атомы, так как шума практически нет.

Электронная плотность
Рисунок 8. Восстановление электронной плотности по неполному набору гармоник (2-37).

Гораздо сильнее на электронную плотность влияет отсутствие гармоник из середины набора, так как становится неразличимым положение водородов (пики их сигналов не отличимы от шума), но точно определяются тяжелые атомы. Добавление одной гармоники, номер которой больше номера гармоники, при которой происходит отличное восстановление, никак не влияет на конечный результат.

Электронная плотность Электронная плотность
Рисунок 9. Восстановление электронной плотности по неполному набору гармоник (0-20, 23-37), с добавлением одной гармоники (47).
Таблица 1
Качество восстановления электронной плотности при различных параметрах
Набор гармоник Разрешение (Å) Полнота данных (%) Шум амплитуды (% от величины F) Шум фазы (% от величины P) Качество восстановления
Полный набор гармоник без шума
0-5 6 100 0 0 плохое
0-10 3 100 0 0 плохое
0-20 1.5 100 0 0 среднее
0-30 1 100 0 0 хорошее
0-37 0.81 100 0 0 отличное
0-45 0.67 100 0 0 отличное
Полный набор гармоник с шумом
0-37 0.81 100 5 0 отличное
0-37 0.81 100 25 0 хорошее
0-37 0.81 100 60 0 среднее
0-37 0.81 100 0 5 хорошее
0-37 0.81 100 0 25 среднее
0-37 0.81 100 0 60 среднее
0-37 0.81 100 5 5 хорошое
0-37 0.81 100 25 25 хорошее
0-37 0.81 100 60 60 среднее
Неполный набор гармоник
2-37 0.81 94.6 0 0 отличное
0-20, 23-37 0.81 94.6 0 0 среднее
0-37, 47 0.81 100 0 0 отличное