Задание 1. Prody и B-факторы часть 1

Остаток с наименьшим средним B-фактором (8.63) - ASP 24 цепи A. Остаток с наибольшим средним B-фактором (46.95) - LYS 188 цепи A. Разброс значений B-факторов атомов LYS 188 значительно больше разброса атомов ASP 24 (65.42 и 1.47 соответственно)

Лизин 188 является C-терминальным, полностью окружен раствором, а аспартат 24 является остатком альфа-спирали (рисунок 1). ASP 24 образует водородную связь и солевой мостик с ARG 28 (рисунок 2). Таким образом, аспартат 24 находится в сильно структурированном участке белка, подвижность когорого ограничена из-за стабильной вторичной структуры, а также сам остаток дополнительно стабилизирован двумя взаимодействиями, что сильно затружняет подвижность этого остатка и делает его B-фактор минимальным. В случае лизина 188 нет ни стабилизирующих элементов вторичной структуры, ни дополнительных контактов, поэтому его подвижность ничто не сдерживает и B-фактор у него максимальный.

Рисунок 1. Структура 6AF7 в виде cartoon. Остатки с наименьшим (оранжевый) и наибольшим (фиолетовый) средним B-фактором выделены с помощью sticks.

Рисунок 2. Остаток с наименьшим средним B-фактором (8.63) - ASP 24 цепи A. ASP 24 образует водородную связь (желтая пунктирная линия) и солевой мостик (голубая пунктирная линия) с ARG 28 (рисунок 2)

Задание 2. Prody и B-факторы часть 2

На рисунке 3 представлен scatter plot зависимости B-фактора от расстояния до центра белка 6AF7. Видно, что при уведичении растояния от центра масс B-фактор увеличивается. Возможно, это связано с тем, что при удалении от центра масс белка увеличивается также и подвижность остатков.

Рисунок 3. Scatter plot зависимости B-фактора от расстояния до центра белка 6AF7.

Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным

Цель практикума попытаться воспроизвести ход кристаллографического эксперимента на умозрительном и крайне упрощенном примере. Мы сами сгенерируем электронную плотность, разложим ее в ряд Фурье, а затем будем восстанавливать исходную функцию, имитируя ту или иную степень потери данных в ходе эксперимента.

Упрощения, которые вводятся в этом практикуме:

Нужно задать расположение 2 или 3 молекул состоящих из двух или трех атомов (желательно в сумме иметь не больше семи атомов). Раскидать по отрезку в 30 ангстрем 5-7 точек.

Задание функции

Функция задается на интервале [0,30]. Моделируется в 1D график электронной плотности молекулы. Функция имеет вид суммы нескольких гауссовых кривых с центром в разных точках. Иногда - на расстоянии 1-1.5 ангстрем - модель ковалентно связанных атомов; иногда 3-5 ангстрем (расстояние между молекулами).

Гауссова функция определяется числами lambda, beta, gamma по формуле:

gauss = lambda*exp(-(beta^2)*(X-gamma)^2) Здесь a^2=a*a.

Изображение модели функции электронной плотности представлено на рисунке 4.

Расчет амплитуд и фаз сигналов, моделирующих экспериментальные данные

При моделировании экспериментальных данных учитывается, что в эксперименте, во-первых, определяются амплитуды не для всех сигналов; во-вторых, интенсивности сигналов (следовательно, и амплитуды) определяются с ошибкой; в-третьих, фазы определяется для всех измененных сигналов, но тоже с ошибкой.

Добавление гауссового шума к амплитудам (параметр -F <число>) и фазам (-P <число>) искажает все вычисленные амплитуды и фазы. Пример: -F 20 (шум 20%) приводит к тому, что к каждой амплитуде прибавляется случайное число, распределенное нормально с параметрами: среднее = 0, среднее квадратичное отклонение (сигма)=0.2*F. Аналогично действует параметр -P <число>

Таким образом мы получаем наборы смоделированных экспериментальных данных, по которым можем начать восстанавливать нашу исходную электронную плотность, с целью сравнить ее с исходной (идеально), и определить как именно неполнота данных из эксперимента влияет на качество восстановления электронной плотности.

На рисунках 5-9 показаны восстановленные без зашумления (F = 0, P = 0) по различным начальным интервалам (5 интервалов: 0-5, 0-10, 0-20, 0-35, 0-50) гармоник функции электронной плотности. Качество восстановление увеличивается с длиной интервала: на интервале 0-5 качество восстановления плохое (нельзя определить количество молекул, сходство с исходной функцией отсутствует), на 0-10 - среднее (можно определить количество молекул, нельзя - количество атомов в молекулах, низкое сходство с исходной функцией), на 0-20 - хорошее (можно примерно определить количество атомов в молекулах, удовлетворительное сходство с исходной функцией), на интервалах 0-35, 0-50 - отличное (количество атомов в молекула определяется точно, высокое сходство с исходной функцией).

На рисунках 10-13 представлены восстановленные без зашумления (F = 0, P = 0) по различным по неполным наборам гармоник: 12-15, 17-30 (53%), 0-10, 15, 17-30 (80%), 0-10, 12-15, 17-30 (87%) и 0-15, 17-30 (93%). Чем меньше полнота гармоники, тем хуже качество восстановления (51% - плохое качество восстановления, 74%, 83% - хорошее, 86% - отличное). Возможно, имеет значение, какие именно гармоники удаляляются: гармоники, отвечающие низкому разрешению (начальные гармоники), играют не так сильно важны в различении деталей, как гармоники более высокого разрешения.

Востановленные с зашумлением амплитуд (F = 20%, 50%, 70%) или фаз (P = 20%, 50%, 70%) функции электронной плотности изображены на рисунках 14-19. При добавлении шума к амплитудам возможность определения количества атомов не теряется, но с увеличением процента шума (20% -> 50% -> 70%) качество восстановления падает (отличное -> хорошее -> среднее соответственно). При добавлении шума к фазам качество восстановления падает аналогично, но сильнее и при 70% вазового шума различить количество атомов в молекулах невозможно (хорошее -> среднее -> плохое соответственно). При зашумлении и фаз, и амплитуд (F = 20%, P = 70%; F = 70%, P = 20%, F = 20%, P = 20% и F = 70%, P = 70% на рисунках 20-23) в случае комбинации 70% шума к амплитудам и 20% шума к фазам определить количество атомов возможно, в отличии от комбинации 20% шума к амплитудам и 70% шума к фазам. В свзяи с этим можно предположить, что высокий процент шума в фазах сильнее влияет на качество восстановления (делает его хуже) исходной функции, чем высокий процент шума в амплитудах. При одинаково высоком уровне шума и в амплитудах, и в фазах (F = 70%, P = 70%) качество восстановления плохое.

Определения, пояснения

Скрипты, используемые в задании

python2 compile-func.py -g 30,3,3+40,3,4.3+2,3.5,6.5+30,3,7.5 -o f.txt   
python2 func2fourier.py -i f.txt -o f_ft.txt   
python2 fourier-filter.py -i f_ft.txt -r 0-5 -o f_ft_0-5.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-5.txt -o f_f_0-5.txt   
python2 fourier-filter.py -i f_ft.txt -r 0-10 -o f_ft_0-10.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-10.txt -o f_f_0-10.txt    
python2 fourier-filter.py -i f_ft.txt -r 0-20 -o f_ft_0-20.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-20.txt -o f_f_0-20.txt    
python2 fourier-filter.py -i f_ft.txt -r 0-35 -o f_ft_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-35.txt -o f_f_0-35.txt    
python2 fourier-filter.py -i f_ft.txt -r 0-50 -o f_ft_0-50.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-50.txt -o f_f_0-50.txt
python2 fourier-filter.py -i f_ft.txt -r 0-15,17-30 -o f_ft_0-15_17-30.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-15_17-30.txt -o f_f_0-15_17-30.txt
python2 fourier-filter.py -i f_ft.txt -r 0-10,12-15,17-30 -o f_ft_0-10_12-15_17-30.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-10_12-15_17-30.txt -o f_f_0-10_12-15_17-30.txt
python2 fourier-filter.py -i f_ft.txt -r 0-10,15,17-30 -o f_ft_0-10_15_17-30.txt 
python2 fourier2func.py -f f.txt -i f_ft_0-10_15_17-30.txt -o f_f_0-10_15_17-30.txt
python2 fourier-filter.py -i f_ft.txt -r 12-15,17-30 -o f_ft_12-15_17-30.txt 
python2 fourier2func.py -f f.txt -i f_ft_12-15_17-30.txt -o f_f_12-15_17-30.txt
python2 func2fourier.py -i f.txt -o f_ft_F20.txt -F 20 
python2 fourier-filter.py -i f_ft_F20.txt -r 0-35 -o f_ft_F20_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_F20_0-35.txt -o f_f_F20_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_F50.txt -F 50 
python2 fourier-filter.py -i f_ft_F50.txt -r 0-35 -o f_ft_F50_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_F50_0-35.txt -o f_f_F50_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_F70.txt -F 70 
python2 fourier-filter.py -i f_ft_F70.txt -r 0-35 -o f_ft_F70_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_F70_0-35.txt -o f_f_F70_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_P20.txt -P 20 
python2 fourier-filter.py -i f_ft_P20.txt -r 0-35 -o f_ft_P20_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_P20_0-35.txt -o f_f_P20_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_P50.txt -P 50 
python2 fourier-filter.py -i f_ft_P50.txt -r 0-35 -o f_ft_P50_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_P50_0-35.txt -o f_f_P50_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_P70.txt -P 70 
python2 fourier-filter.py -i f_ft_P70.txt -r 0-35 -o f_ft_P70_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_P70_0-35.txt -o f_f_P70_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_F20_P70.txt -F 20 -P 70
python2 fourier-filter.py -i f_ft_F20_P70.txt -r 0-35 -o f_ft_F20_P70_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_F20_P70_0-35.txt -o f_f_F20_P70_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_F70_P20.txt -F 70 -P 20
python2 fourier-filter.py -i f_ft_F70_P20.txt -r 0-35 -o f_ft_F70_P20_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_F70_P20_0-35.txt -o f_f_F70_P20_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_F20_P20.txt -F 20 -P 20
python2 fourier-filter.py -i f_ft_F20_P20.txt -r 0-35 -o f_ft_F20_P20_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_F20_P20_0-35.txt -o f_f_F20_P20_0-35.txt
python2 func2fourier.py -i f.txt -o f_ft_F70_P70.txt -F 70 -P 70
python2 fourier-filter.py -i f_ft_F70_P70.txt -r 0-35 -o f_ft_F70_P70_0-35.txt 
python2 fourier2func.py -f f.txt -i f_ft_F70_P70_0-35.txt -o f_f_F70_P70_0-35.txt

Рисунок 4. Функция электронной плотности, заданная compile-func.py -g 30,3,3+40,3,4.3+2,3.5,6.5+30,3,7.5. Это сумма четырех гауссовых функций: их максимумы в точках 3, 4.3, 6.5, 7.5, высота 30, 40, 2, 30 соответственно; третий - низкий - пик моделирует атом водорода.

Восстановленные функции электронной плотности без защумления амплитуд и фаз по полному набору гармоник

Рисунок 5. Восстановленные без зашумления амплитуд (P) и фаз (F) по первым 5 гармоникам функции электронной плотности.

Рисунок 6. Восстановленные без зашумления амплитуд (P) и фаз (F) по первым 10 гармоникам функции электронной плотности.

Рисунок 7. Восстановленные без зашумления амплитуд (P) и фаз (F) по первым 20 гармоникам функции электронной плотности.

Рисунок 8. Восстановленные без зашумления амплитуд (P) и фаз (F) по первым 35 гармоникам функции электронной плотности.

Рисунок 9. Восстановленные без зашумления амплитуд (P) и фаз (F) по первым 50 гармоникам функции электронной плотности.

Восстановленные функции электронной плотности без защумления амплитуд и фаз по неполному набору гармоник

Рисунок 10. Восстановленные без зашумления амплитуд (P) и фаз (F) по 93% гармоник функции электронной плотности.

Рисунок 11. Восстановленные без зашумления амплитуд (P) и фаз (F) по 87% гармоник функции электронной плотности.

Рисунок 12. Восстановленные без зашумления амплитуд (P) и фаз (F) по 80% гармоник функции электронной плотности.

Рисунок 13. Восстановленные без зашумления амплитуд (P) и фаз (F) по 53% гармоник функции электронной плотности.

Восстановленные функции электронной плотности с защумлением фаз по полному набору гармоник

Рисунок 14. Восстановленные с зашумления фаз (F=20%) по первым 35 гармоникам функции электронной плотности.

Рисунок 15. Восстановленные с зашумлением фаз (F=50%) по первым 35 гармоникам функции электронной плотности.

Рисунок 16. Восстановленные с зашумлениум фаз (F=70%) по первым 35 гармоникам функции электронной плотности.

Восстановленные функции электронной плотности с защумлением амплитуд по полному набору гармоник

Рисунок 17. Восстановленные с зашумлением амплитуд (P=20%) по первым 35 гармоникам функции электронной плотности.

Рисунок 18. Восстановленные с зашумлением амплитуд (P=50%) по первым 35 гармоникам функции электронной плотности.

Рисунок 19. Восстановленные с зашумлением амплитуд (P=70%) по первым 35 гармоникам функции электронной плотности.

Восстановленные функции электронной плотности с защумлением амплитуд и фаз по полному набору гармоник

Рисунок 20. Восстановленные с зашумлением амплитуд (F=20%) и фаз (P=70%) по первым 35 гармоникам функции электронной плотности.

Рисунок 21. Восстановленные с зашумлением амплитуд (F=70%) и фаз (P=20%) по первым 35 гармоникам функции электронной плотности.

Рисунок 22. Восстановленные с зашумлением амплитуд (F=20%) и фаз (P=20%) по первым 35 гармоникам функции электронной плотности.

Рисунок 23. Восстановленные с зашумлением амплитуд (F=70%) и фаз (P=70%) по первым 35 гармоникам функции электронной плотности.

Таблица 1. Восстановление функции по коэффициентам ряда Фурье.

Набор гармоник Разрешение(Å) Полнота данных(%) Шум амплитуды (% от величины F) Шум фазы (% от величины phi) Качество восстановления(отличное, хорошее, среднее, плохое)
Полный набор гармоник
0–5 6 100 0 0 Плохое
0–10 3 100 0 0 Среднее
0–20 1,50 100 0 0 Хорошее
0–35 0,86 100 0 0 Отличное
0–50 0,86 100 0 0 Отличное
0–35 0,86 100 20 0 Отличное
0–35 0,86 100 50 0 Хорошее
0–35 0,86 100 70 0 Среднее
0–35 0,86 100 0 20 Хорошее
0–35 0,86 100 0 50 Среднее
0–35 0,86 100 0 70 Плохое
0–35 0,86 100 20 70 Плохое
0–35 0,86 100 70 20 Отличное
0–35 0,86 100 20 20 Хорошее
0–35 0,86 100 70 70 Плохое
Неполный набор гармоник
12-15, 17-30 1,86 53 0 0 Плохое
0-10, 15, 17-30 1,25 80 0 0 Среднее
0-10, 12-15, 17-30 1.15 87 0 0 Хорошее
0-15, 17-30 1.07 93 0 0 Отличное