Python для структур и не только




Prody и B-факторы часть 1


MAX MIN
Средний B-фактор атомов остатка 13.962941176470588 2.803
Аминокислота Глутамин-21 Цистеин-43
Атом
'N' 'CA' 'C' 'O' 'CB' 'CG' 'CD' 'OE1' 'NE2' 'D' 'DA' 'DB2' 'DB3' 'DG2' 'DG3' 'DE21' 'DE22'
'N' 'CA' 'C' 'O' 'CB' 'SG' 'D' 'DA' 'DB2' 'DB3'
B-фактор атома
3.28 4.06 2.9 3.7 7.83 14.01 21.81 23.79 27.88 3.94 4.87 9.39 9.39 16.81 16.81 33.45 33.45
2.45 2.5 2.65 2.95 2.57 2.81 2.94 3 3.08 3.08

С помощью prody был найден остаток, средний B-фактор атомов которого максимален. Это глутамин-21, находящийся в петле белка без вторичной структуры неподалёку от сульфат-иона. Его высокий средний В-фактор можно объяснить высоким В-фактором его атомов водорода у атомов С-гамма и азота.

Более подробно этот остаток разобран в практикуме 2 в разделе "В-фактор"

Остаток с минимальным В-фактором - это цистеин-43, находящийся в составе альфа-спирали и в ковалентной связи с железно-серным кластером. Это объясняет низкую подвижность атомов остатка.


Рисунок 1. Изображение остатков с максимальным и минимальным В-фактором.


Prody и B-факторы часть 2


С помощью prody были найдены центры масс белка и всех остатков. Scatter plot зависимости B-фактора от расстояния до центра белка изображён на рисунке 2.

Рисунок 2. Scatter-plot зависимости B-фактора от расстояния до центра белка

На графике видно, что В-фактор остатка растёт при увеличении расстояния от центра масс белка. Линейная модель значимо описывает данную зависимость, хотя и с низким R-squared, который можно объяснить дополнительным влиянием индивидуального окружения остатков и вторичной структуры остова на подвижность атомов.

Call:
lm(formula = distance ~ beta, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-8.5337 -1.9769 -0.0742  2.3183  5.1875 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   7.7513     0.8558   9.057 6.13e-14 ***
beta          0.6501     0.1487   4.373 3.62e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.977 on 81 degrees of freedom
Multiple R-squared:  0.191,	Adjusted R-squared:  0.181 
F-statistic: 19.12 on 1 and 81 DF,  p-value: 3.62e-05


Как работает восстановление функции электронной плотности по экспериментальным данным


Функция электронной плотности была задана для 7 точек:

compile-func.py -g 41,3.2,24.5+2,3.5,25.5+31.0,3.2,20+2,3.5,12.5+10,2,10+25,3,6.5+25,3.5,4.5

Рисунок 3.1 Гауссова функция для заданных точек

На графиках восстановленной функции по полному набору гармоник видно, что с увеличением их количества (n) улучшается качество восстановления исходной функции. При небольших n уже хорошо видны большие пики. При n = 40 восстановление становится отличным.


n = 20

n = 30

n = 40
Рисунок 3.2 Графики восстановленной функции по полному набору гармоник с различными n

На графиках восстановленной функции по полному набору гармоник с добавленным шумом малые пики, моделирующие атомы водорода, гораздо сложнее определить.


n = 25

n = 30

n = 40
Рисунок 3.3 Графики восстановленной функции по полному набору гармоник с различными n и добавленным шумом

Удаление первых гармоник из набора для восстановленной функции позволяет определить пики, но смещает восстановленную функцию вниз. Это смещение вызвано тем, что из набора гармоник была убрана константа (n = 0)

Удаление средних гармоник приводит к увеличению уровня шума и, следовательно, к ухудшению качества восстановления.

Добавление дополнительной гармоники практически не влияет на итоговое восстановление. Оно лишь еле заметно уменьшило уровень шума.


n = 2-40

n = 0-20,25-40

n = 0-40,50
Рисунок 3.4 Графики восстановленной функции по неполному набору гармоник

Итоговая таблица находится здесь