Python для структур и не только

Задание 1. Prody и B-факторы часть 1

В данном задании было необходимо при помощи библиотеки Prody найти остатки с самым маленьким и самым большим средним значением B-фактора. Исследовалась структура OXA-48 бета-лактамазы (PDB-id 7aux).

Таким образом, остаток с самым маленьким значением B-фактора (16.001) - это лейцин 196 из цепи B

Таким образом, остаток с самым большим значением B-фактора (61.58) - это глутамат 37 из цепи А

Далее эти остатки были визуализированы в структуре белка с помощью Pymol

pic1.png

Остаток с минимальным значением расположен очень близко к центру белка и вблизи сайта взаимодействия с хлором, в его окружении также много неполярных аминокислот, по всей видимости гидрофобные взаимодействия обеспечивают жесткое положение этого остатка, что находит отражение в низких значениях B-фактора. pic2.png

Для остатка с максимальным значением B-фактора ситуация иная, он наоборот расположен на поверхности белка, "торчит" наружу, и отсутствуют стабилизирующие его взаимодействия с другими частями белка, что по всей видимости приводит к большой подвижности и соответственно большому значению B-фактора pic3.png

Задание 2. Prody и B-факторы часть 2

В данном задании было необходимо для каждого остатка посчитать его центр масс с среднее значение В-фактора, посчитать центр масс всего белка, а затем изучить зависимость В-фактора остатка от расстояния до центра масс всего белка.

Как мы видим, B-фактор растет с увеличением расстояния до центра масс белка, зависимость кажется достаточно близкой к линейной. Построим корреляцию Пирсона.

Полученные значения подтверждают, что для данного белка такая зависимость близка к линейной. Однако также можно заметить, что существуют остатки на некотором отдалении от центра масс с очень низкими значениями B-фактора. Это может объясняться тем, что рассматриваемый белок состоит из двух цепей, которые вместе составляют не шар, а скорее напоминают "гантелю" по форме, и остатки расположенные близко к центрам этих отдельных субъединиц так же могут быть сильно зафиксированы.

Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным

Целью данного задания было на упрощенном одномерном примере при помощи python смоделировать РСА эксперимент и восстановление электронной плотности по "экспериментальным" данным. Для этого сначала при помощи предоставленного скрипта генерируется одномерная функция электронной плотности для некоторого набора атомов:

Далее были сделаны разложения полученной функции на гармоники при помощи скрипта с добавлением различных параметров шума при помощи изменения входных параметров (-F и -P). (В скрипты были внесены незначительные изменения для адаптации под python 3 версии)

Далее на первом этапе производилось восстановление исходной функции по различному количеству первых гармоник (первые 10, 20, 30 и 40 гармоник) и оценивалось их качество. В данной работе использовался следующий набор критериев качества:

Гармоники 0-10:

Гармоники 0-20:

Гармоники 0-30:

Гармоники 0-40:

На электронной плотности, восстановленной по: первым 10 гармоникам видны только очертания молекул, качество восстановления - плохое первым 20 гармоникам можно различить некоторые атомы, но не все, качество восстановления - среднее первым 30 гармоникам можно предсказать атомы, если знать их количество (иначе один из атомов, будет приниматься за шум), качество восстановления - хорошее первым 40 гармоникам определить положение максимумов всех атомов, качество восстановления - отличное

Далее анализировались функции с различными внесенными значениями шума, использовался набор гармоник, который давал "отличное" качество восстановления (первые 40).

10% шум по амплитудам:

30% шум по амплитудам:

50% шум по амплитудам:

10% шум по фазам:

30% шум по фазам:

50% шум по фазам:

10% шум по амплитудам и 10% по фазам:

Шум 30% по амплитудам и 10% по фазам:

Шум 30% по амплитудам и 10% по фазам:

Для шума 10% по амплитуде качество было хорошим, для всех остальных же рассмотренных случаев - средним. В целом можно отметить, что шум внесенный в фазы сильнее влияет на качество восстановления, чем шум, внесенный в амплитуды (хотя в большинстве случаев по рассматриваемым критериям качество было одинаковое, можно отметить, что для равных значений шума, внесенного в амплитуды и фазы, пики на графике для аплитуд были более отличимы, чем на крафике для фаз).

Далее рассматривались неполные наборы гармоник:

Набор гармоник 2-40:

Набор гармоник 5-40:

Набор гармоник 0-25, 30-40:

Набор гармоник 0-30, 35-40:

Качества полученных восстановлений можно оценить следующим образом:

Таким образом можно сделать вывод, что первые гармоники играют более важныю роль в качестве восстановления, чем последующие.

image.png