Python для структур и не только

Prody и B-факторы часть 1

	MAX	MIN
Средний B-фактор атомов остатка	13.962941176470588	2.803
Аминокислота	Глутамин-21	Цистеин-43
Атом	'N' 'CA' 'C' 'O' 'CB' 'CG' 'CD' 'OE1' 'NE2' 'D' 'DA' 'DB2' 'DB3' 'DG2' 'DG3' 'DE21' 'DE22'	'N' 'CA' 'C' 'O' 'CB' 'SG' 'D' 'DA' 'DB2' 'DB3'
B-фактор атома	3.28 4.06 2.9 3.7 7.83 14.01 21.81 23.79 27.88 3.94 4.87 9.39 9.39 16.81 16.81 33.45 33.45	2.45 2.5 2.65 2.95 2.57 2.81 2.94 3 3.08 3.08

С помощью prody был найден остаток, средний B-фактор атомов которого максимален. Это глутамин-21, находящийся в петле белка без вторичной структуры неподалёку от сульфат-иона. Его высокий средний В-фактор можно объяснить высоким В-фактором его атомов водорода у атомов С-гамма и азота.

Более подробно этот остаток разобран в практикуме 2 в разделе "В-фактор"

Остаток с минимальным В-фактором - это цистеин-43, находящийся в составе альфа-спирали и в ковалентной связи с железно-серным кластером. Это объясняет низкую подвижность атомов остатка.

**Рисунок 1.** Изображение остатков с максимальным и минимальным В-фактором.

Prody и B-факторы часть 2

С помощью prody были найдены центры масс белка и всех остатков. Scatter plot зависимости B-фактора от расстояния до центра белка изображён на рисунке 2.

**Рисунок 2.** Scatter-plot зависимости B-фактора от расстояния до центра белка

На графике видно, что В-фактор остатка растёт при увеличении расстояния от центра масс белка. Линейная модель значимо описывает данную зависимость, хотя и с низким R-squared, который можно объяснить дополнительным влиянием индивидуального окружения остатков и вторичной структуры остова на подвижность атомов.

Call:
lm(formula = distance ~ beta, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-8.5337 -1.9769 -0.0742  2.3183  5.1875 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   7.7513     0.8558   9.057 6.13e-14 ***
beta          0.6501     0.1487   4.373 3.62e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.977 on 81 degrees of freedom
Multiple R-squared:  0.191,	Adjusted R-squared:  0.181 
F-statistic: 19.12 on 1 and 81 DF,  p-value: 3.62e-05

Как работает восстановление функции электронной плотности по экспериментальным данным

Функция электронной плотности была задана для 7 точек:

compile-func.py -g 41,3.2,24.5+2,3.5,25.5+31.0,3.2,20+2,3.5,12.5+10,2,10+25,3,6.5+25,3.5,4.5

**Рисунок 3.1** Гауссова функция для заданных точек

На графиках восстановленной функции по полному набору гармоник видно, что с увеличением их количества (n) улучшается качество восстановления исходной функции. При небольших n уже хорошо видны большие пики. При n = 40 восстановление становится отличным.

Рисунок 3.2 Графики восстановленной функции по полному набору гармоник с различными n

На графиках восстановленной функции по полному набору гармоник с добавленным шумом малые пики, моделирующие атомы водорода, гораздо сложнее определить.

Рисунок 3.3 Графики восстановленной функции по полному набору гармоник с различными n и добавленным шумом

Удаление первых гармоник из набора для восстановленной функции позволяет определить пики, но смещает восстановленную функцию вниз. Это смещение вызвано тем, что из набора гармоник была убрана константа (n = 0)

Удаление средних гармоник приводит к увеличению уровня шума и, следовательно, к ухудшению качества восстановления.

Добавление дополнительной гармоники практически не влияет на итоговое восстановление. Оно лишь еле заметно уменьшило уровень шума.

Рисунок 3.4 Графики восстановленной функции по неполному набору гармоник

Итоговая таблица находится здесь