Практикум 3. Python для структур и не только
1.Prody и B-факторы часть 1
Prody - это бесплатный пакет Python с открытым исходным кодом для анализа структурной динамики
белков. Поищем с его помощью остатки белка
6AF7
с различными значениями В-фактора.
Остаток с максимальным средним значением В-фактора - LYS-188, среднее значение В-фактора - 46,95.
Остаток с минимальным средним значененим В-фактора - ASP-24, среднее значение В-фактора - 8,63.
Название остатка |
Среднее значение В-фактора |
Разброс значнений В-факторов атомов |
LYS-188 |
46,95 |
65,42 |
ASP-24 |
8,63 |
1,25 |
Общий вид расположения найденных остатков.
Как видно, лизин - терминальный остаток. Его атомы более подвижны и это одна из причин, по которой
он обладает наибольшим средним значением В-фактора. Он не стабилизируется водородными связями с атомами белка. Лизины у соседей
по кристаллу находятся рядом друг с другом, но между ними нет водородных связей. Они "лежат" на поверхности, удерживаясь там,
видимо, какими-то электростатическими взаимодействиями.
LYS-188 на поверхности у двух белков-соседей
Аспартат находится в альфа-спирали. Его пололжение стабилизирует водородная связь с азотом аргинина ARG-28. Также он плотно
спрятан между соседними молекулами белка в кристалле.
Водородная связь ASP-24 с азотом аргинина ARG-28
2.Prody и B-факторы часть 2
Далее для кажого остатка и для всего белка были посчитаны центры масс. Ниже представлен график
зависимости среднего значения В-фактора остатка от его расстояния до центра масс.
Как видно на графике, чем ближе остаток находится к центру
белка, тем меньше его среднее значение В-фактора.
3.Как работает восстановление функции электронной плотности по экспериментальным данным
В этом задании нужно на одномерном примере показать восстановление ЭП по экспериментальным данным.
Для начала создадим "молекулярную систему" и функцию ЭП для нее с помощью следующей команды:
compile-func.py -g 8,3,5+14,3,6.5+8,3,8+1,3,12+6,3,13+7,3,14.2 -o func.txt
Получаем текстовый файл, в котором отражена зависимость ЭП от координаты.
Первые три пика - это молекула оксида кремния, вторые три пика - синильная кислота.
Восстановление ЭП с разными параметрами
Ниже представлены графики, где непрерывной черной линией показана начальная функция ЭП, а пунктирной
линией показаны восстановленные функции ЭП.
Были выбраны полные гармоники с n = 10, n = 20 и n = 40. Для восстановления
по неполным гармоникам были выбраны следуюшие наборы: со 3 по 30 гармоники, набор с пропущенной
каждой шестой гармоникой (0-4, 6-10, 12-16, 18-22, 24-28, 30-34, 36-40), набор с пропуском "в центре" (0-15, 30-40)
и набор с пропуском центре и без первых 5 гармоник в начале (5-19, 25-40).
Итоговую таблицу с разрешениями и оценкой качества восстановления можно найти
тут.
Восстановление функции ЭП без добавления шума к амплитуде и фазе. Полные гармоники
Рис 1. Набор графиков востановленной функции ЭП по полным гармоникам. Непрерывная линия -
исходная функция ЭП, пунктирная линия - восстановленная.
Видно, что при n = 10 отдельные пики отличить невозможно, можно только угадать общий размер молекул
и их количество. При n = 20 пики меньше изначальных, но можно определить значение максимума и пики не сливаются
с шумом, кроме атома водорода. При n = 40 картина выглядит еще лучше - графики почти полностью совпадают.
Так как понятно, что качество восстановления при n = 10 плохое и вряд ли станет лучше при добавлении шумов,
не будем рассматривать его далее (но данные есть в итоговой таблице).
Восстановление функции ЭП без добавления шума к амплитуде и фазе. Неполные гармоники
Данные эксперимента нечасто содержат в себе полные наборы гармоник, поэтому попробуем восстановить ЭП по неполному
набору гармоник.
Рис 2. Набор графиков востановленной функции ЭП по неполным гармоникам. Непрерывная линия -
исходная функция ЭП, пунктирная линия - восстановленная.
При удалении первых трех гармоник атомы все еще различимы, можно определить их положение.
При удалении каждой шестой гармоники пики становятся меньше по амплитуде,
вырастает амплитуда шума. В наборе 3 появляются как будто лишние атомы в первой молекуле. В наборе 4 вторую молекулу
невозможно отличить от шума, кислороды в оксиде кремния тоже слабо отличаются от шума. Водород неразличим нигде, кроме, возможно,
первого набора.
Восстановление функции ЭП с добавлением шума к амплитуде. Полные гармоники
С помощью файла func2fourier.py можно также добавть искажения по амплитуде и фазе. По очереди будем
добавлять шум в размере 20% - сначала к амплитудам (F = 20), затем к фазам (P = 20).
№2
№3
Рис 3. Набор графиков востановленной функции ЭП по полным гармоникам, шум по амплитуде F = 20. Непрерывная линия -
исходная функция ЭП, пунктирная линия - восстановленная.
Видно, что уменьшается амплитуда значимых пиков, увеличивается амплитуда шума в полных
наборах по сравнению с данными без шума. В наборе с 40 гармониками водород практически неотличим от шума, но в целом восстановление
можно назвать почти отличным.
Восстановление функции ЭП с добавлением шума к амплитуде. Неполные гармоники
Рис 4. Набор графиков востановленной функции ЭП по неполным гармоникам, шум по амплитуде F = 20. Непрерывная линия -
исходная функция ЭП, пунктирная линия - восстановленная.
Амплитуда шума возрастает, атомы все еще различимы в первх двух наборах, кроме водорода. В целом картинка довольно
похожа на то, что мы видим на графиках без шума по амплитуде.
Восстановление функции ЭП с добавлением шума к фазе. Полные гармоники
№2
№3
Рис 5. Набор графиков востановленной функции ЭП по полным гармоникам, шум по фазе P = 20. Непрерывная линия -
исходная функция ЭП, пунктирная линия - восстановленная.
Во втором наборе хорошо различимой остается первая молекула. При n = 40 различимо все, кроме водорода. В полных наборах
при добавлении шума по амплитуде водород, хоть и слабо, но можно было различить, здесь - нет.
Восстановление функции ЭП с добавлением шума к фазе. Неполные гармоники
Рис 6. Набор графиков востановленной функции ЭП по неполным гармоникам, шум по фазе P = 20. Непрерывная линия -
исходная функция ЭП, пунктирная линия - восстановленная.
Амплитуда значимых пиков падает, хорошо различимыми остаются молекулы по первому и второму набору. В наборе 4
явно можно различить кремний, остальные атомы слабо отличимы от шума.
Восстановление функции ЭП с добавлением шума к фазе и к амплитуде. Полные гармоники
№2
№3
Рис 7. Набор графиков востановленной функции ЭП по полным гармоникам, шум по амплитуде F = 20,
по фазе P = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.
Яснее всего положение атомов можно определить в наборе 3. В наборе 2 отдельные пики тоже видны, но меньше по амплитуде.
Восстановление функции ЭП с добавлением шума к фазе и к амплитуде. Неполные гармоники
Рис 8. Набор графиков востановленной функции ЭП по неполным гармоникам, шум по амплитуде F = 20,
по фазе P = 20. Непрерывная линия - исходная функция ЭП, пунктирная линия - восстановленная.
В первых двух наборах можно различить первые 2-3 атома, вторая молекула различима хуже. В третьем наборе
все также есть лишние пики, хорошо разичим кремний, как и в четвертом наборе.
Выводы
Подводя итог, можно сказать, что:
Полные гармоники позволяют лучше восстановить ЭП, чем неполные, при достаточном количестве гармоник в наборе.
Равномерные "дырки" в наборах гармоник лучше, чем пропуск в "середине" набора - по ним функция
ЭП восстаналивается ближе к идеальным значениям.
Пропуск гармоник в начале влияет на смещение графика по оси Х вниз.
Шум по фазе имеет более критическое влияние, чем шум по амплитуде.
© Нестеренко Екатерина 2017-2020