Главная
О себе
Список курсов
Сайт ФББ

Практикум 3. Prody. Восстановление функции электронной плотности

Задание 1. Prody и B-факторы: максимум и минимум

Целью данного задания являлось применение библиотеки Prody для анализа PDB-файла на примере структуры в комплексе с пирролидиновым ингибитором S47 (PDB ID: 3Q6Y, совпадает со структурой из практикума 2). Были найдены остатки с наибольшим и наименьшим средним B-фактором: аспартат 54 (Средний B-фактор: 59,89) и глицин 306 (6,61), соответственно. Ниже представлены записи о них в файле PDB (B-факторы выделены жирным), а на рисунке 1 показано их положение в структуре.

...
ATOM    356  N   ASP A  54     -11.767  -9.702  19.035  1.00 57.36           N
ATOM    357  CA  ASP A  54     -12.743 -10.055  18.010  1.00 58.50           C
ATOM    358  C   ASP A  54     -12.112 -10.891  16.900  1.00 55.44           C
ATOM    359  O   ASP A  54     -12.379 -10.671  15.718  1.00 60.98           O
ATOM    360  CB  ASP A  54     -13.385  -8.801  17.433  1.00 67.15           C
...
ATOM   2095  N   GLY A 306       3.159   4.878   0.068  1.00  6.75           N
ATOM   2096  CA  GLY A 306       2.634   3.687   0.712  1.00  7.10           C
ATOM   2097  C   GLY A 306       2.707   2.479  -0.198  1.00  5.70           C
ATOM   2098  O   GLY A 306       3.419   2.473  -1.203  1.00  6.90           O
...

Рисунок 1. Глицин 306 (синий) и аспартат 54 (розовый) в структуре белка (PDB ID: 3Q6Y).

Остаток с наименьшим средним B-фактором - глицин 306 - входит в альфа-спираль и состоит по сути только из остова, поэтому обладает небольшой подвижностью. Аспартат 54 обладает наибольшим средним B-фактором и находится на обрыве петли в структуре (предшествующий участок 47-53 пропущен), поэтому практически ничем не стабилизирован.

Задание 2. Prody и B-факторы: зависимость от расстояния

Рисунок 2. Модель 3Q6Y, окрашенная по B-фактору. Розовым обозначен центр масс белка.

Рисунок 3. Зависимость среднего B-фактора остатка от удалённости от центра масс.

У модели 3Q6Y Был рассчитан центр масс: x=4,843; y=-0,135; z=4,693. Его положение в структуре представлено на рисунке 2. Затем была представлена зависимость среднего B-фактора остатка от удалённости его центра масс от центра масс фермента (рисунок 3). Для наглядности график был ограничен сверху по оси ординат значением 40, так как выше лежала только точка со значением 59,89 (аспартат 54, удаленность от центра масс: 23.62 Å, рассмотрен в задании 1). Заметно, что разброс точек с увеличением значения B-фактора растёт по мере удаления от центра масс белка. Это подтверждается значениями коэффициентов корреляции: коэффициент линейной корреляции Пирсона составил 0,42 (p-value=5,77e-14), монотонной корреляции Спирмена - 0,59 (p-value=1,51e-30), что подтверждает наличие монотонной зависимости средней силы между измеренными величинами.

Исходный код к заданиям 1 и 2: открыть в новой вкладке.

Задание 3. Восстановление функции электронной плотности по экспериментальным данным

Целью данного задания было смоделировать электронную плотность (ЭП) линейной системы на отрезке 30 Å из нескольких атомов, а затем разложить ее на гармоники Фурье, возможно, с шумом, по ним воссоздать исходную функцию ЭП, поэкспериментировать с полнотой набора гармоник. Действия проводились с помощью набора скриптов (отличаются от исходных небольшими изменениями, позволяющими работать с ними через Python 3), а также для упрощения работы с различными параметрами они были объединены для запуска в ноутбуке. Там же находится скрипт, который по заданному выражению для выборки гармоник высчитывает разрешение с заданной полнотой. В данном для неполного набора гармоник я указывал разрешение, которому соответствует полнота не менее 90%. Важно, что рисунки с шумом в ноутбуке могут не соответствовать рисункам на сайте, так как шумы случайны, поэтому повторный запуск ячейки приводит к появлению отличающихся рисунков.

Рисунок 4. Исходная электронная плотность модели.

Итак, для системы, состоящей из CO2 и H2S, была рассчитана одномерная ЭП, представленная на рисунке 4, следующей командой:

python3 scripts/compile-func.py -g 8,3,2+6,3,3.4+8,3,4.6+1,3,10+16,3,11.5+1,3,13 -o func.txt
Группа параметров lambda, beta, gamma, разделенных запятой, определяет следующее:
  • lambda - высоту гауссинана (имитирует число электронов),
  • beta - ширину гауссиана (значение 3 примерно соответствует 1 Å),
  • gamma - положение центра атома.

Затем проводились эксперименты с числом гармоник, их полнотой, а также с шумом при определении амплитуды и фаз гармоник Фурье. Структурированные результаты разобранных далее приближений со всеми параметрами (разрешение, покрытие, качество) приведены в таблице. Ниже же рассмотрим наиболее примечательные моменты.

Часть 1. Влияние числа гармоник в полном наборе на качество без шума

Рисунок 5. Нулевая гармоника Фурье - константа.
Рисунок 6. Гармоники 0 и 1.

На рисунках 5 и 6 представлены самые начальные приближения функции гармониками Фурье в виде пунктирной линии (верно и далее): нулевая гармоника - просто константа, первая гармоника уже задаёт синусоиду. И хотя различить ещё ничего нельзя, можно заметить, что пик функции приходится на область, где находятся молекулы.

Рисунок 7. Гармоники 0-3.
Рисунок 8. Гармоники 0-4.

На рисунках 7 и 8 показаны функции, восстановленные по гармоникам 0-3 и 0-4, соответственно. Всего по 4 гармноникам можно определить приблизительное расположение молекул, а 5 гармоник (0-4) уже позволяют чётко детектировать центры молекул по пикам функции, благо что молекулы в эксперименте симметричные.

Рисунок 9. Гармоники 0-10
Рисунок 10. Гармоники 0-20.

На рисунке 9 после синтеза 11 гармоник пики слева разбиваются на 2, приблизительно соответствующие расположению виртуальных кислородов. При этом намёк на третий пик, соответствующий углероду, появляется только после синтеза 21 гармоники на рисунке 10.

Рисунок 11. Гармоники 0-25.
Рисунок 12. Гармоники 0-30.

Синтез 26 гармоник (рисунок 11) позволил довольно чётко определить пики всех атомов, однако, водороды по амплитуде не очень сильно отличаются от колебаний функции, возможно, добавление шума уже не позволит их детектировать. Эта гипотеза будет проверена в следующей части. 31 гармоника (рисунок 12) уже гораздо более чётко описывает положения всех атомов, включая водороды. Это как раз соответствует разрешению в 1 Å.

Рисунок 13. Гармоники 0-40.
Рисунок 14. Гармоники 0-50.

На рисунке 13 41 гармоника задаёт функцию, практически полностью совпадающую с исходной, но в некоторых местах всё-таки можно увидеть точки "экспериметальной" плотности за пределами заданной. А вот 51 гармоника на рисунке 14 вообще описывает функцию почти без погрешностей, это соответствует разрешению 0,6 Å, которое на практике трудно достижимо. В целом же, 31 гармоника, т.е. разрешения в 1 Å оказалось вполне достаточно для того, чтобы уверенно определить положения атомов и высоты пиков.

Часть 2. Влияние шума на качество синтеза Фурье

Рисунок 15a. Шум по фазе: 5%,
Гармоники 0-25
Рисунок 15b. Гармоники 0-30

Теперь будем сравнивать влияние шума на качество синтеза Фурье из гармоник 0-25 и 0-30 (здесь и далее рисунки a и b, соответственно). Начнём с шума по фазе. Вспомним, что без шума уже 26 гармоник точно определить положение водородов. Однако добавление шума в 5% к определению фаз гармоник делает картину менее чёткой: без знания о том, что самый высокий пик соответствует сере в H2S нельзя уверенно сказать, что 2 соседних пика соответствуют водородам, а следующие справа пики - нет. На качество идентификации водородов при разрешении 1 Å шум в 5% почти не повлиял.

Рисунок 16a. Шум по фазе: 10%,
Гармоники 0-25
Рисунок 16b. Гармоники 0-30

Шум в 10% по фазе (рисунок 16) уже практически стирает разницу между разрешениями 1,2 Å и 1 Å: экспериментальные плотности всё ещё достаточно чётко описывают пики исходной, однако, появляются шумы, которые можно даже принять за водороды. Поскольку характер шума случайный, рисунок a оказался даже лучше b.

Рисунок 17a. Шум по фазе: 20%,
Гармоники 0-25
Рисунок 17b. Гармоники 0-30

При шуме в 20% (рисунок 17) про качество определения водородов говорить уже не приходится, а ситуацию необходимо рассматривать более общо. На рисунке a пики углерода и второго кислорода стали почти одинаковыми по высоте, а справа появился пик, который можно даже принять за какой-нибудь атом с несколькими электронами, а не просто водород. На рисунке b картина немного лучше: пики атомов с большим порядковым номером всё ещё отличаются друг от друга, шум не даёт основания вписать в плотность ещё какой-нибудь атом, кроме водорода.

Рисунок 18a. Шум по фазе: 30%,
Гармоники 0-25
Рисунок 18b. Гармоники 0-30

Шум в 30% к фазе (рисунок 18) приводит к примерно одинаковому качеству синтеза Фурье что для 26 гармоник, что для 31: атомы с близкими порядковыми номерами нельзя уверенно отличить друг от друга, появляется множество пиков, которые могут задавать атомы средней тяжести.

Рисунок 19a. Шум по амплитуде: 5%,
Гармоники 0-25
Рисунок 19b. Гармоники 0-30

Теперь будем рассматривать влияние шума по амплитуде на результат восстановления плотности. На рисунке 19 видно, что шум в 5% практически не повлиял на качество для обоих разрешений.

Рисунок 20a. Шум по амплитуде: 10%,
Гармоники 0-25
Рисунок 20b. Гармоники 0-30

Шум в 10% (рисунок 20) уже не позволяет определить положение водородов без предварительных знаний о молекулах в системе. При этом из синтеза гармоник 0-25 уже нельзя точно определить взаиморасположение атомов углерода и кислорода в CO2, так как высоты их пиков становятся примерно одинаковыми.

Рисунок 21a. Шум по амплитуде: 20%,
Гармоники 0-25
Рисунок 21b. Гармоники 0-30

На удивление, шум в 20% по амплитуде (рисунок 21) менее значительно повлиял на качество, чем шум в 10%. Это ещё раз подтверждает случайный характер шума: иногда и небольшой шум может сильно повлиять на значимую информацию, а иногда более существенный шум не сильно сказывается на качестве. На обоих рисунках можно определить как положения, так и относительные высоты всех пиков, кроме водорода.

Рисунок 22a. Шум по амплитуде: 30%,
Гармоники 0-25
Рисунок 22b. Гармоники 0-30

30% шума к амплитуде (рисунок 22) смазали высоты пиков атомов CO2, но при этом случаев, где можно по ошибке вписать атом с большим числом электронов, чем у водорода, оказалось существенно меньше, чем при аналогичной величине шума по фазе. Таким образом, шум по фазе в целом всё же сильнее сказался на качестве, чем по амплитуде. Из данного наблюдения выпадает ситуация с 10% шума по амплитуде, когда картинка оказалось немного хуже, чем при таком же шуме по фазе. Однако это можно объяснить случайностью.

Рисунок 23a. Шум по амплитуде и фазе: 5%,
Гармоники 0-25
Рисунок 23b. Гармоники 0-30

Теперь будем комбинировать шум и по фазе, и по амплитуде. Для простоты приравняем их друг к другу. На рисунке 23 комбинированный шум составляет 5% для каждого параметра. На рисунке a уже нельзя определить положения водородов без знаний о молекулах в системе. Появляется большое число пиков, которые могли бы им соответствовать. На рисунке b ситуация обстоит немного лучше: водороды всё ещё хорошо отличимы от шума.

Рисунок 24a. Шум по амплитуде и фазе: 10%,
Гармоники 0-25
Рисунок 24b. Гармоники 0-30

На рисунке 24 при шуме в 10% граница между разрешениями стирается. Водороды "появляются" везде. Пики кислородов становятся разной высоты, но всё ещё выше пиков углерода.

Рисунок 25a. Шум по амплитуде и фазе: 20%,
Гармоники 0-25
Рисунок 25b. Гармоники 0-30

20% шума (рисунок 25) приводит к тому, что появляются случайные пики атомов-"не водородов". Пики CO2 продолжают смазываться и уже некоторые кислороды становятся одинаковой высоты с углеродом.

Рисунок 26a. Шум по амплитуде: 30%,
Гармоники 0-25
Рисунок 26b. Гармоники 0-30

Шум в 30% по обоим параметрам (рисунок 26) приводит к очень любопытным последствиям: достаточно чётко можно видеть только серу. Остальные пики могут соответствовать самым различным атомам. Пики, соответствующие реальным атомам не отличимы от шума.

Таким образом, напрашивается довольно логичный вывод: не так важно разрешение набора гармоник, как то, насколько качественно в ходе эксперимента удалось снять сигнал, так как уже 10% шума делает невозможным качественное определение водородов даже при ангстремном разрешении.

Часть 3. Неполный набор гармоник

В этой части рассмотрим случай неполного набора гармоник. На рисунке 27 показан синтез из гармоник 1-30. Как известно, гармоника 0 - константа. Так что график функции просто опустился немного вниз, что и ожидалось. Потеря ещё и первой гармоники (рисунок 28) привело к возникновению "горба" справа. Вообще он не сильно мешает определению положения атомов, однако правый водород из H2S уже не так хорошо различим. Пропуск первых 5 (рисунок 29) гармоник сделал водороды плохо различимыми, однако пики остальных атомов всё ещё хорошо отличимы как по расположению, так и по относительной высоте.

Рисунок 27. Гармоники 1-30
Рисунок 28. Гармоники 2-30
Рисунок 29. Гармоники 5-30

Пропуск 4-ой гармоники (рисунок 30) привёл к тому, что водороды оказались плохо различимы, но остальные атомы очень хорошо различимы на фоне осцилляций. Пропуск 15-ой гармоники (рисунок 31) еще меньше повлиял на восстановление плотности: даже пики водородов хорошо отличимы от колебаний, однако, они расположены ближе к сере, чем в исходной плотности. Потеря 28 гармоники (рисунок 32) вообще никак не отразилась на качестве, что логично, так как уже при гармониках 0-25 водороды без шума были очень хорошо различимы.

Рисунок 30. Гармоники 0-3 и 5-30
Рисунок 31. Гармоники 0-14 и 16-30
Рисунок 32. Гармоники 0-27 и 29-30
Рисунок 33. Гармоники 0-10 и 20-30
Рисунок 9 (повтор). Гармоники 0-10

Если же опустить 10 гармоник в середине (рисунок 33), качество заметно ухудшится. При этом видны положения всех атомов CO2, хоть и не различимы по высоте. Пики водородов H2S наоборот оказались гипертрофированными. Формально разрешение данного набора при пороге полноты 90% составляет 3 Å, однако, если сравнить его с полным набором гармоник, имеющим то же разрешение (рисунок 9), можно заметить, что всё же гармоники 20-30 вносят существенный вклад в синтез.

Рисунок 34. Гармоники 0-8, 10-19, 21-25 и 27-30

Наконец, посмотрим на пропуск гармоник 9, 20 и 26 из набора 0-30 (рисунок 34). Водороды в этом случае можно определить только в случае, если известно что они есть в системе только в молекуле сероводорода. Пики атомов CO2 оказались примерно одинаковой высоты. Так что для получения качественного восстановления электронной плотности необходимо не только высокое разрешение (здесь оно всё ещё 1 Å при полноте 90,3%), но и наличие как можно большего числа предшествующих гармоник.

Рисунок 35. Шум по амплитуде и фазе: 5%,
Гармоники 0-8, 10-19, 21-25 и 27-30
Рисунок 23b (повтор). Гармоники 0-30

Теперь будем добавлять одинаковый шум по фазе и амплитуде к предыдущему случаю с 3 пропущенными гармониками, а также сравним ситуацию с аналогичным применением шума для полного набора гармоник с тем же разрешением. Шум в 5% (рисунок 35) не сильно повлиял на восстановление без шума: водороды перестали быть чётко видимыми уже после пропуска 3 гармоник, высоты пиков CO2 тоже смазались ранее.

Рисунок 36. Шум по амплитуде и фазе: 20%,
Гармоники 0-8, 10-19, 21-25 и 27-30
Рисунок 25b (повтор). Гармоники 0-30

Шум в 20% сделал рисунок 36 похожим на 25b, однако, на графике, полученном из синтеза без 3 гармоник, осциллирующие пики всё же немного выше. Также плотность на рисунке 36 допускает объяснение её добавлением "лишних" атомов-"не водородов", так как появляются случайные пики достаточно большой высоты.