Практикум 3. Python для структур и не только

1.Prody и B-факторы часть 1

Prody - это бесплатный пакет Python с открытым исходным кодом для анализа структурной динамики белков. Поищем с его помощью остатки белка 6AF7 с различными значениями В-фактора.
Остаток с максимальным средним значением В-фактора - LYS-188, среднее значение В-фактора - 46,95.
Остаток с минимальным средним значененим В-фактора - ASP-24, среднее значение В-фактора - 8,63.
Название остатка Среднее значение В-фактора Разброс значнений В-факторов атомов
LYS-188 46,95 65,42
ASP-24 8,63 1,25

residues Общий вид расположения найденных остатков.

Как видно, лизин - терминальный остаток. Его атомы более подвижны и это одна из причин, по которой он обладает наибольшим средним значением В-фактора. Он не стабилизируется водородными связями с атомами белка. Лизины у соседей по кристаллу находятся рядом друг с другом, но между ними нет водородных связей. Они "лежат" на поверхности, удерживаясь там, видимо, какими-то электростатическими взаимодействиями.
lyz
LYS-188 на поверхности у двух белков-соседей

Аспартат находится в альфа-спирали. Его пололжение стабилизирует водородная связь с азотом аргинина ARG-28. Также он плотно спрятан между соседними молекулами белка в кристалле.
asp
Водородная связь ASP-24 с азотом аргинина ARG-28

2.Prody и B-факторы часть 2

Далее для кажого остатка и для всего белка были посчитаны центры масс. Ниже представлен график зависимости среднего значения В-фактора остатка от его расстояния до центра масс.
b-factors and distances
Как видно на графике, чем ближе остаток находится к центру белка, тем меньше его среднее значение В-фактора.

3.Как работает восстановление функции электронной плотности по экспериментальным данным

В этом задании нужно на одномерном примере показать восстановление ЭП по экспериментальным данным.
Для начала создадим "молекулярную систему" и функцию ЭП для нее с помощью следующей команды:
compile-func.py -g 8,3,5+14,3,6.5+8,3,8+1,3,12+6,3,13+7,3,14.2 -o func.txt 

Получаем текстовый файл, в котором отражена зависимость ЭП от координаты.
ideal
Первые три пика - это молекула оксида кремния, вторые три пика - синильная кислота.

Восстановление ЭП с разными параметрами

Ниже представлены графики, где непрерывной черной линией показана начальная функция ЭП, а пунктирной линией показаны восстановленные функции ЭП. Были выбраны полные гармоники с n = 10, n = 20 и n = 40. Для восстановления по неполным гармоникам были выбраны следуюшие наборы: со 3 по 30 гармоники, набор с пропущенной каждой шестой гармоникой (0-4, 6-10, 12-16, 18-22, 24-28, 30-34, 36-40), набор с пропуском "в центре" (0-15, 30-40) и набор с пропуском центре и без первых 5 гармоник в начале (5-19, 25-40).
Итоговую таблицу с разрешениями и оценкой качества восстановления можно найти тут.

Восстановление функции ЭП без добавления шума к амплитуде и фазе. Полные гармоники

def10 №1 def40 №3
def20 №2
Рис 1. Набор графиков востановленной функции ЭП по полным гармоникам. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


Видно, что при n = 10 отдельные пики отличить невозможно, можно только угадать общий размер молекул и их количество. При n = 20 пики меньше изначальных, но можно определить значение максимума и пики не сливаются с шумом, кроме атома водорода. При n = 40 картина выглядит еще лучше - графики почти полностью совпадают. Так как понятно, что качество восстановления при n = 10 плохое и вряд ли станет лучше при добавлении шумов, не будем рассматривать его далее (но данные есть в итоговой таблице).

Восстановление функции ЭП без добавления шума к амплитуде и фазе. Неполные гармоники

Данные эксперимента нечасто содержат в себе полные наборы гармоник, поэтому попробуем восстановить ЭП по неполному набору гармоник.
def10 №1 def40 №3
def20 №2 def40 №4
Рис 2. Набор графиков востановленной функции ЭП по неполным гармоникам. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


При удалении первых трех гармоник атомы все еще различимы, можно определить их положение. При удалении каждой шестой гармоники пики становятся меньше по амплитуде, вырастает амплитуда шума. В наборе 3 появляются как будто лишние атомы в первой молекуле. В наборе 4 вторую молекулу невозможно отличить от шума, кислороды в оксиде кремния тоже слабо отличаются от шума. Водород неразличим нигде, кроме, возможно, первого набора.

Восстановление функции ЭП с добавлением шума к амплитуде. Полные гармоники

С помощью файла func2fourier.py можно также добавть искажения по амплитуде и фазе. По очереди будем добавлять шум в размере 20% - сначала к амплитудам (F = 20), затем к фазам (P = 20).
def10 №2
def40 №3
Рис 3. Набор графиков востановленной функции ЭП по полным гармоникам, шум по амплитуде F = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


Видно, что уменьшается амплитуда значимых пиков, увеличивается амплитуда шума в полных наборах по сравнению с данными без шума. В наборе с 40 гармониками водород практически неотличим от шума, но в целом восстановление можно назвать почти отличным.

Восстановление функции ЭП с добавлением шума к амплитуде. Неполные гармоники

def10 №1 def40 №3
def20 №2 def40 №4
Рис 4. Набор графиков востановленной функции ЭП по неполным гармоникам, шум по амплитуде F = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


Амплитуда шума возрастает, атомы все еще различимы в первх двух наборах, кроме водорода. В целом картинка довольно похожа на то, что мы видим на графиках без шума по амплитуде.

Восстановление функции ЭП с добавлением шума к фазе. Полные гармоники

def10 №2
def40 №3
Рис 5. Набор графиков востановленной функции ЭП по полным гармоникам, шум по фазе P = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


Во втором наборе хорошо различимой остается первая молекула. При n = 40 различимо все, кроме водорода. В полных наборах при добавлении шума по амплитуде водород, хоть и слабо, но можно было различить, здесь - нет.

Восстановление функции ЭП с добавлением шума к фазе. Неполные гармоники

def10 №1 def40 №3
def20 №2 def40 №4
Рис 6. Набор графиков востановленной функции ЭП по неполным гармоникам, шум по фазе P = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


Амплитуда значимых пиков падает, хорошо различимыми остаются молекулы по первому и второму набору. В наборе 4 явно можно различить кремний, остальные атомы слабо отличимы от шума.

Восстановление функции ЭП с добавлением шума к фазе и к амплитуде. Полные гармоники

def10 №2
def40 №3
Рис 7. Набор графиков востановленной функции ЭП по полным гармоникам, шум по амплитуде F = 20, по фазе P = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


Яснее всего положение атомов можно определить в наборе 3. В наборе 2 отдельные пики тоже видны, но меньше по амплитуде.

Восстановление функции ЭП с добавлением шума к фазе и к амплитуде. Неполные гармоники

def10 №1 def40 №3
def20 №2 def40 №4
Рис 8. Набор графиков востановленной функции ЭП по неполным гармоникам, шум по амплитуде F = 20, по фазе P = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.


В первых двух наборах можно различить первые 2-3 атома, вторая молекула различима хуже. В третьем наборе все также есть лишние пики, хорошо разичим кремний, как и в четвертом наборе.

Выводы

Подводя итог, можно сказать, что:
  • Полные гармоники позволяют лучше восстановить ЭП, чем неполные, при достаточном количестве гармоник в наборе.
  • Равномерные "дырки" в наборах гармоник лучше, чем пропуск в "середине" набора - по ним функция ЭП восстаналивается ближе к идеальным значениям.
  • Пропуск гармоник в начале влияет на смещение графика по оси Х вниз.
  • Шум по фазе имеет более критическое влияние, чем шум по амплитуде.

  • © Нестеренко Екатерина 2017-2020