Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2021

Электронная плотность

Задание 1. ЭП: хорошая и плохая расшифровки.

Вам дано два PDB ID (PDB1, PDB2), их можно найти на отдельном листе в ведомости. Они соответствуют двум кристаллографическим расшифровкам одного и того же белка, при этом их качество сильно различается. Откройте структуры в Pymol. Есть ли различия, которые сразу бросаются в глаза?

Ваши структуры могут быть не совсем идентичны в плане состава: могут быть разные ионы, добавки к растворителю, лиганды, возможно даже единичные замены. Эти различия не стоит рассматривать как следствия из разного качества моделей.

Скачайте их карты электронной плотности, изучите их с помощью volume или mesh. Подготовьте 2 изображения. На них отобразите один и тот же регион в двух структурах. Покажите электронную плотность только вокруг остова на одном и том же уровне подрезки (подберите carve так, чтобы ничего не терялось, но и от боковых радикалов плотность по возможности не попадала). Опишите различия. В какой записи плотность лучше согласуется с положениями отдельных атомов? О чем это говорит? Какая структура, по вашему мнению, имеет лучшее разрешение? Почему вы так решили? Зайдите на страницы ваших записей в PDB, возьмите оттуда значения разрешения, приведите их в отчете. Совпали ли ваши выводы с информацией на сайте?

Задание 2. ЭП и положение в структуре.

Работайте с PDB3 (на том же листе в ведомости). Постройте серию mesh'ей вокруг остова всего белка (только остова! также не должно быть плотности от соседей белка по ячейке – используйте carve) на уровнях подрезки 1, 2, 3, покажите остов в виде sticks или lines (и ничего больше), подготовьте изображения. Вы заметите, что при переходе 1 -> 2 -> 3 какие-то регионы остова структуры первыми перестают быть покрытыми mesh'ем. Что это за регионы? Где они расположены относительно всей молекулы? Насколько хорошо они взаимодействуют с остальным белком? Есть ли тут тенденция?

Задание 3. ЭП и типы атомов.

Работайте с PDB3 (на том же листе в ведомости). Постройте электронную плотность вокруг лиганда, который присутствует в этой модели, также на уровнях подрезки 1, 2 и 3, подготовьте изображения. Все ли атомы покрыты плотностью на уровне подрезки 1? Что происходит с покрытием при увеличении уровня подрезки? Вокруг каких атомов плотность сохраняется дольше всего, с чем это может быть связано?

Задание 4* - на доп.баллы. Восстановление функции электронной плотности по экспериментальным данным.

Цель задания – попытаться воспроизвести ход кристаллографического эксперимента на умозрительном и крайне упрощенном примере. Мы сами сгенерируем электронную плотность, разложим ее в ряд Фурье, а затем будем восстанавливать исходную функцию, имитируя ту или иную степень потери данных в ходе эксперимента.

В этом задании мы воспользовались возможностями питона и напрограммировали игрушечный одномерный пример, иллюстрирующий восстановление функции ЭП по экспериментальным данным.

Скрипты для выполнения задания.

Создание модельной функции ЭП в одномерной элементарной ячейке

Будем рассматривать одномерный пример: несколько молекул, расположенных вдоль отрезка длиной 30 ангстрем. Для простоты возьмите несколько линейных молекул (например, ацетилен, синильная кислота, оксид азота II, фтороводород и тд.). Молекулы расположите близко (3-5 ангстрем) к друг другу. Длины химических связей в молекулах можно померить, скачав их структуры в формате sdf из PubChem.

Нарисуйте свою систему. Молекулы должны лежать на одной прямой. Определите координаты атомов (по оси Х) вашей системы.

Задайте ЭП для вашей системы с помощью скрипта compile-func.py. Этот скрипт приближает ЭП атома как гауссиан по формуле: gauss = lambda*exp(-(beta2)*(X-gamma)2). Для каждого атома укажите число электронов (lambda), координату центра атома (gamma), ширину пика (beta) примите за 3.

Например формула python compile-func.py -g 14,3,2.5+12,3,3.6+1,3,4.6+16,3,7.6+14,3,8.9 задаст вам систему из молекул HCN и NO, расположенных на одной прямой на расстоянии в 3 ангстрема между друг другом (см. картинку). Не используйте систему из примера, придумайте свою.

В результате запуска скрипта получится набор значений, описывающих ЭП вашей системы вдоль оси Х. Постройте и сохраните график функции ЭП по этим значениям.

Расчет параметров сигнала, моделирующих экспериментальные данные: амплитуды и фазы

Теперь у нас есть электронная плотность, смоделируем получение экспериментальных данных - амплитуд и фаз для ряда гармоник Фурье, рассчитанных по входной функции ЭП.

Коэффициенты Фурье (до фиксированного номера, см текст скрипта) рассчитываются с помощью скрипта func2fourier.py Входной файл -– функция, полученная как выходной файл скрипта compile-func.py. Выходной файл имеет формат: <номер гармоники> <амплитуда> <фаза>.

Если запустить func2fourier.py с параметрами -F <число от 0 до 100> или -P <число от 0 до 100>, произойдёт добавление гауссового шума к амплитудам или фазам в выдаче соответственно (см. хэлп к скрипту).

В ходе эксперимента у нас обычно получается разрешить далеко не все гармоники для искомой функции ЭП. Кроме того, многие значения получаются с погрешностью. Смоделируйте эту ситуацию. Сделайте несколько наборов разложений исходной функции:

Потерю значений для некоторых гармоник мы будем моделировать в задании ниже. Это можно сделать, убрав или закомментирвав (#) строки гармоник, которые вы хотите опустить.

Восстановление функции ЭП по экспериментальным данным

Восстановление функции по отобранным гармоникам выполняется скриптом fourier2func.py. Кроме графика, выдается также файл с исходной и восстановленной функцией. Для отключения графика исходной функции служит параметр -s. См. хэлп к скрипту (-h).

Вставьте в отчёт таблицу со столбцами: Гармоники, Разрешение (ангстремы), Полнота, Шум амплитуды %, Шум фазы %, Качество MSE, Комментарий; ее надо будет заполнить результатами.

1. Постройте график восстановленной функции по полному набору гармоник с n = 0, 1, .... Найдите n_0 при котором восстановление отличное (см. ниже, Оценка качества восстановления ЭП). Документируйте результат, приведя графики для 3-4х n, включая n_0, и заполнив строчки таблицы.

2. Добавьте шум к амплитудам и фазам при восстановлении по полному набору гармоник 0,...,n_0. Оцените качество восстановления в зависимости от шума, 2-3 результата внесите в таблицу.

3. Удалите одну-две начальные гармоники (номер 0, номера 0-1 и т.п.) Документируйте результат в протоколе.

4. Удалите 5-10% гармоник из середины набора 0-n_0. Результаты документируйте.

5. Добавьте одну гармонику с номером, превышающим n_0 на 10. Результаты документируйте.

6. Заполните графы "Разрешение" и "Полнота данных" для выбранного разрешения так, как считали бы нужным по результатам компьютерных экспериментов. См. определения.

Сделайте выводы, потеря каких частей ряда гармоник сильнее влияет на восстановление качества ЭП? Что сильнее влияет на качество восстановления, шум по модулям или по фазам?

Оценка качества восстановления ЭП

Для каждой восстановленной из гармоник функции ЭП сравните её график с исходным. Оцените качество восстановления по следующим критериям:

* Отличное восстановление – по графику восстановленной функции можно определить положение максимума всех атомов * Хорошее восстановление – можно угадать положение всех максимумов, зная число атомов, хотя на восстановленной функции максимумы от атомов не отличимы от шума * Среднее восстановление – положение каких-то атомов определить по восстановленной функции нельзя, других - можно * Плохое восстановление – положение атомов определить не представляется возможным, можно только предсказать примерный размер молекул

2021/7/task2 (последним исправлял пользователь a.fokina 2024-10-27 13:04:13)