Практикум 3. Prody. Восстановление функции ЭП

Задание 1. Prody и B-факторы часть 1

С помощью Prody мы нашли GLN-226 с максимальным средним B-фактором 31.55 и GLY-26 с минимальным средним B-фактором 5.74 (Рис. 1). Оба находятся в цепи А.

GLN-226 смотрит не внутрь глобулы, а наружу, т.е. во внешнюю среду, причём B-фактор увеличивается от остовных атомов к атомам боковой цепи от 28.22 до 36.8 с SD = 2.71.

GLY-26 является частью гидрофобного ядра, что, по-видимому, и обеспечивает минимальный средний B-фактор. Он изменяется от 5.53 до 6.22 с SD = 0.28.

Рисунок 1. Структура с PDB: 3czf, цепь А показана в виде Cartoon, остатки с минимальным (GLY-26) и максимальным (GLN-226) средним B-фактором - в виде Sticks. Параметр ray_trace_mode, 1.

Задание 2. Prody и B-факторы часть 2

Здесь для каждого остатка нашей структуры вычислили средний B-фактор по его атомам и его центр масс. Далее был подсчитан центр масс для всей ассиметрической ячейки. Считаю, что справедливее считать центр масс для всей ячейки целиком, а не для каждой цепи, поскольку эти цепи образуют устойчивый комплекс, раз уж нам удалось закристаллизовать и выяснить его структуру. После, для каждого остатка было посчитано расстояние от его центра масс до центра масс комплекса и построен график (Рис. 2).

Предполагалось, что чем дальше остаток от центра белка, тем больше B-фактор, т.к. внешние части молекулы больше склонны к термической подвижности. Для данной структуры такая зависимость слабо прослеживается. Возможно, так происходит из-за того, что структура состоит из трёх цепей и хорошо структурированные части, имеющие низкий B-фактор, расположены далеко от центра масс.

Рисунок 2. Scatter plot зависимости B-фактора от расстояния до центра ассиметрической ячейки.

Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным

В этом задании мы воспользуемся возможностями питона и напрограммируем игрушечный одномерный пример, иллюстрирующий восстановление функции ЭП по экспериментальным данным. Для начала сгенерируем эту самую функцию электронной плотности. Пусть это будет молекула из трёх атомов и молекула из двух атомов на расстоянии друг от друга в 3.5 Å.

Полные наборы гармоник

Чем больше гармоник, тем лучше восстановление исходной функции (Рис. 3). При наборе гармоник 0-3 даже нельзя восстановить положение отдельных молекул, видим только общий пик, при 0-10 качество восстановления - плохое, читаются только отдельные молекулы, при 0-20 уже определяются положения более тяжёлых атомов, 0-25 - могут быть сомнения насчёт положения водородов. При 0-30 восстановление уже можно считать отличным, т.к. можем определить положения отдельных атомов, а при 0-40 все положения атомов читаются просто превосходно.

Рисунок 3. Графики восстановленных ЭП (пунктирная линия) при разных полных наборах гармоник. Исходная функция ЭП показана сплошной линией.

В реальном эксперименте определять положение атомов мешает шум. Нужно учитывать, что, во-первых, амплитуды определяются на для всех сигналов, во-вторых, интенсивности сигналов, следовательно, и амплитуды определяются с ошибкой, в-третьих, фаза для всех изменённых сигналов определяется с ошибкой. Поэтому попробуем смоделировать реальный эксперимент, добавив шум амплитуды и шум фазы.

Анализировать будем набор гармоник 0-30 с отличным качеством восстановления. Для начала проварьируем отдельно шум амплитуды (5, 20 и 50%) и шум фазы (5, 20 и 50%), а потом посмотрим, как влияет на качество восстановления шум и амплитуды, и фазы.

При увеличении шума амплитуды неопределённость в положении водородов возникает на 20%. На 50% удаётся точно определить только положения тяжёлых атомов. При увеличении шума фазы неопределённость в положении водородов возникает уже на 5% (Рис. 4). Также видим, что базовая линия шумит сильнее на 5%, если добавлять шум фазы, а не шум амплитуды.

Заметим, что при добавлении обоих шумов на 5% качество восстановления лучше, чем в случае, если у нас есть только шум фазы или только шум амплитуды. Видимо наличие небольшого шума амплитуды компенсирует шум фазы, но такое наблюдается только на уровне 5%, так что это видимо просто артефакт.

Таким образом, даже небольшой шум фазы сильнее влияет на качество восстановления, чем шум амплитуды. И отмечу, что даже при возможности кристаллизовать белок и провести эксперимент не всегда можно установить структуру, потому что не всегда можно решить фазовую проблему.

Рисунок 4. Графики восстановленных ЭП (пунктирная линия) с набором гармоник 0-30. Разный уровень шума. Исходная функция ЭП показана сплошной линией. F - шум амплитуды, %; P - шум фазы, %.

Неполные наборы гармоник

В реальном эксперименте не всегда удаётся получить полный набор гармоник, поэтому будет интересно посмотреть, как влияет на восстановление исходной функции ЭП неполнота набора гармоник.

При удалении первой гармоники видим, что график перемещается вниз по оси ординат, что логично. Если удалить первые две гармоники, то увидим, что график как бы "проседает", но все пики, соответвующие разным атомам всё ещё читаются (Рис. 5). Это происходит из-за того, что происходит вычитание синусоиды с большим периодом

Рисунок 5. Графики восстановленных ЭП (пунктирная линия) с разным набором гармоник. Исходная функция ЭП показана сплошной линией.

Если убирать несколько гармоник из середины, причём из разных мест - ближе к началу или ближе к концу, то несмотря на неполноту гармоник можно достаточно хорошо различить тяжёлые атомы. С водородами может быть неопределённость (Рис. 6)

Рисунок 6. Графики восстановленных ЭП (пунктирная линия) с разным набором гармоник. Исходная функция ЭП показана сплошной линией.

При добавлении 40 гармоники график практически не изменяется (Рис. 7).

Рисунок 7. Графики восстановленных ЭП (пунктирная линия) с разным набором гармоник. Исходная функция ЭП показана сплошной линией.

Отчётная таблица представлена в файле.

Примеры команд:

run compile-func.py -g 2,3,14.3+10,3.5,15.3+2,3,16.3+7,3.5,19.8+6,3.5,21.3 -o file.txt

run func2fourier.py -i file.txt -o file_ft.txt

run fourier-filter.py -i file_ft.txt -r 0-7 -o file_ft_0-7.txt

run fourier2func.py -f file.txt -i file_ft_0-7.txt -o 0-7.txt

© Marina Kan, 2020