Задание 1. Prody и B-факторы часть 1

Для фермента DPS, выделенного из E.coli с PDB ID: 6B0D, были получен cредние В-факторы остатков (то есть среднее значение всех В-факторов атомов этого остатка) с помощью пакета Prody.
Так, среди всех аминокислот данного белка наибольшим средним В-фактором, равным 69.012, обладает аланин 11 цепи Е (на рис.5. покрашен красным). Составляющие его атомы имеют разброс в значениях по В-фактору от 66.32 у СВ-атома до 77.76 у О-атома. Являясь С-концевой аминокислотой, аланин 11 цепи Е депонирован наружу белковой глобулы, что объясняет его подвижность и, как следствие, такой высокий В-фактор.
Самым низким средним В-фактором, равным 8.237, обладает остаток аспарагина 130 цепи В (на рис.5. покрашен синим). Разброс В-факторов составляющих его атомов от 7.30 у CG-атомы до 10.23 у О-атома- разброс значительно меньше, чем у аланина 11 цепи Е, обладающего наибольшим средним В-фактором. Аспарагин 130 цепи В входит в состав альфа-петли, то есть достаточно фиксирован, к тому же подвижность снижает его взаимодействие по водородной связи с аспартатом 20 цепи С (рис.2).


Рис.1. Аминокислота с самым большим В-фактором (ALA-11 (красный), цепь Е, В-фактор = 69.012) и самым маленьким (ASN-130 (синий), цепь Е, В-фактор = 8.237)


Рис.2. Окружение аспарагина 130, определяющее его низкую подвижность

Задание 2. Prody и B-факторы часть 2

Результаты предыдущего задания показали, что средний В-фактор аминокислотного остатка зависит от его окружения, и, чтобы определить, есть ли связь между В-фактором остатка и расстоянием от его центра масс до центра масс белка была построена диаграмма рассеяния (рис.3). На графике видно, что чем дальше остатки находятся от центра масс белка, тем их средний В-фактор выше (красным покрашена линия тренда, однако зависимость не обязательно линейная, скорее увеличивается разброс и отдельные остатки имеют значения сильно выше среднего). В предыдущем практикуме была выявлена закономерность: аминокислотные остатки, располагающие по периферии белка имеют более высокую подвижность по сравнению с фиксированными остатками внутри глобулы, что можно перенести в термины данного задания: чем дальше остаток от центра масс белка (где находится большинство аминокислот и, соответственно, образовано наибольшее количество контактов) , тем выше его В-фактор, что и показано на графике (рис.3).


Рис.3. Соотношение средних B-факторов остатков белка с PDB ID: 6B0D и расстояния от центра масс остатка до центра масс белка

Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным

Идея этого задания в том, чтобы смоделировать восстановление функции электронной плотности по значительно упрощенным экспериментальным данным.Так, была создана функция в одномерном пространстве имитирующая значительно упрощенную версию начальных данных со следующими ограничениями: атомы находятся на одном отрезке длиной 30 Å, электронная плотность атома описывается гауссовой кривой (максимум колокола находится в центре атома, в молекулах атомы располагаются на расстоянии 1-1,5 Å (ковалентная связь), молекулы на расстоянии 3-5 Å. Далее. полученную функцию разложили в ряд Фурье, затем несколько раз восстановили исходную функцию, имитируя разную степень потери и искажения данных.

1) Задание функции
На первом этапе была создана функция (рис.4), имитирующая распределение электронной плотности . Она задавалась на интервале [0,30] Å А. и в виде суммы нескольких гауссовых кривых с центром в разных точках. Каждая гауссова функция задается уравнением gauss = lambda*exp(-(beta^2)*(X-gamma)^2), где lambda задает высоту гауссиана, отражая число электронов у атома (для водорода lambda=2 (самык маленькие пики), beta задает ширину гауссиана (значение 3 cоответсвует ширине колокола плотности около 1 ангстрем, что похоже на реальную ситуацию и было взято для всех пиков), gamma задает положение центра атома. Созданная функция отображает электронную плотность двух молекул, состоящих из трех атомов каждая. Она была создана, как сумма шести гауссовых функций, с параметрами: lambda — 2, 5, 15, 9, 2, 18, beta — 3 (для всех шести атомов), gamma — 1, 2, 3, 12,13, 14.


Рис.4. Модельная функция электронной плотности системы, состящей из двух молекул, по три атома каждая

2) Восстановление электронной плотности

По функции электронной плотности, полученной при составлении модели в предыдущем пункте, фазы и амплитуды рассчитываются однозначно, однако в настоящем эксперименте обычно происходит искажение части этих параметров от сигналов, к тому же почти не удается получить полный набор данных, от всех сигналов. Поэтому в этой части практикума будут имитироваться добавление шума к сигналам, а также частичная потеря данных для расчета функции электронной плотности.
Во-первых, было смоделировано восстановление функции электронной плотности для полного набора гармоник ряда Фурье, то есть гармоник 0,1,2…n (рис.5). Как видно на приведенных графиках, качество восстановленной функции увеличивается пропорционально размеру набора гармоник.


Рис.5. Восстановление функции электронной плотности по полному набору гармоник (начальный график- непрерывная линия, восстановленный- пунктирная): А- гармоники 0-1; Б- гармоники 0-9; В- гармоники 0-50; Г- гармоники 0-350

Далее моделировалось восстановление функции электронной плотности по полному набору гармоник с добавлением шума (рис.6). При том же количестве гармоник шум (15 или 25% к амлитудам или фазам) ощутимо снижает качество восстановления функции электронной плотности. Более того, при большем искажении фазы, чем амплитуды, перестают угадываться пики атомов водорода и в целом кривая восстановления хуже описывает реальную электронную плотность. Получается, что ошибки в значениях фаз ведут к большему ухудшению разрешения, нежели ошибки в амплидудах.


Рис.6. Восстановление функции электронной плотности по полному набору гармоник с добалением шума (начальный график- непрерывная линия, восстановленный- пунктирная): А- гармоники 0-50 с шумом 15% от величины F и 25% от величины phi; Б- гармоники 0-50 с шумом 25% от величины F и 15% от величины phi;

Во-вторых, было смоделировано восстановление функции электронной плотности для неполного набора гармоник ряда Фурье (рис.7). Так, при исключении первых гармоник угадывается положение пиков, однако начинаются значительные колебания базовой линии. Однако, если исключить «средние» гармоники (рис.7, Г, в данном случае с 60 по 100) то качество разрешения резко падает.
Если же добавить шум к неполному набору гармоник, то наблюдается та же картина, что и с добавлением шума к полному набору гармоник: при большем искажении фаз, чем амплитуд, разрешение хуже (рис.8).


Рис.7. Восстановление функции электронной плотности по неполному набору гармоник (начальный график- непрерывная линия, восстановленный- пунктирная): А- гармоники 0-10,13-400; Б- гармоники 1-9,11-30 ; В- гармоники 3-12,14-40,100; Г- гармоники 0-3,13-60,100-110


Рис.8. Восстановление функции электронной плотности по неполному набору гармоник с добавлением шума (начальный график- непрерывная линия, восстановленный- пунктирная): А- гармоники 0-13,33,133 с шумом 15% от величины F и 25% от величины phi; Б- гармоники 0-14,44,144 с шумом 25% от величины F и 15% от величины phi


Результаты третьего задания практикума в виде таблицы


© Nenartovich Marina 2017