Главная

ФББ МГУ

О себе

Term 7

Python для структур и не только


Задание 1. Prody и B-факторы, часть 1


PDBID: 3CVB
В этом задании было интересно найти и проанализировать с помощью Prody остатки заданной структруры, средний B-фактор атомов которых минимален и максимален. Оказалось, что минимальное среднее по своим атомам значение В-фактора имеет остаток GLY-99 из цепи А (4.3225), а максимальное - GLY-105, цепь В (25.11).
Нужно отметить, что разброс значений B-факторов атомов остатка GLY-105 достаточно большой - около 6 единиц разницы между минимальным и максимальным значением (Таблица 1). При этом, остаток GLY-105 являтеся концевым остатком цепи В и находится на поверхности белковой глобулы, и, что логично, чем ближе к растворителю и дальше от центра молекулы белка находится атом, тем большее значение B-фактора он имеет и, следовательно, большую подвижность.

Таблица 1. Значения В-факторов атомов GLY-105
N CA C O OXT
21.5624.2425.9226.6727.16

Ниже, на рисунке 1.1, можно увидеть местонахождение исследуемых остатков. Молекула белка покрашена по B-фактору палитрой blue_white_red, следовательно, чем меньше В-фактор, тем более остаток синий, чем больше В-фактор, тем более остаток красный.

prot

Рисунок 1.1. GLY-99 (цепь А) с минимальным и GLY-105 (цепь В) с макисмальным значениями В-фактора.

На рисунке 1.2 показаны предполагаемые взаимодействия GLY-99. Как мне кажется, наибольшая стабилизация подвижности глицина осуществляется за счет водородных связей его остова с остовом TYR-87. Эти связи очень стабильны, так как указанные остатки являются элементами антинаправленных бета цепей, составляющих бета-лист. Тем более, что у глицина нет большого подвижного радикала, который может активно двигаться и увеличивать B-фактор.

prot

Рисунок 1.2. GLY-99 (цепь А) с минимальным значением В-фактора и его взаимодействия с окружающими остатками.

Задание 2. Prody и B-факторы, часть 2


PDBID: 3CVB, biological assembly 1
В этом задании нам было интересно построить зависимость между средними значениями B-фактора по атомам аминокислотных остатков и расстояниями от центра масс аминокислотных остатков до центра масс всего белка (рисунок 2.1). Для построения зависимости была взята цепь А биологической сборки 1. Мы можем заметить, что достаточно четко наблюдается тренд по увеличению B-фактора при удалении центра масс аминокислотного остатка от центра масс белка.

plot

Рисунок 2.1.Зависимость В-фактора от расстояния между центрами масс.

Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным

Задание функции электронной плотности происходило с помощью скрипта compile-func.py с помощью команды:

run compile-func.py -g 20,3,5+15,3,6.6+3,2,9.6+17,3,10.6+7,2.5,11.8+10,2.5,15.8+16,3,16.8

Была смоделирована электронная плотность молекулы, состоящей из 3 молекул и 7 атомов, перечислинных ниже. График функции электронной плотности молекулы изображен на рисунке 3.1.

Молекула_1:
Атом_1: число электронов = 20
Атом_2: число электронов = 15
Расстояние Атом_1-Атом_2 = 1,6 Å

Молекула_2:
Атом_1: число электронов = 3
Атом_2: число электронов = 17
Атом_3: число электронов = 7
Расстояние Атом_1-Атом_2 = 1 Å
Расстояние Атом_2-Атом_3 = 1,2 Å

Молекула_3:
Атом_1: число электронов = 10
Атом_2: число электронов = 16
Расстояние Атом_1-Атом_2 = 1 Å

Расстояние Молекула_1-Молекула_2 = 3 Å
Расстояние Молекула_2-Молекула_3 = 4 Å

plot

Рисунок 3.1. 1D график функции электронной плотности смоделированной молекулы.

Расчет амплитуд и фаз сигналов, моделирующих экспериментальные данные, был произведен путем разложения функции в ряд Фурье с помощью скрипта func2fourier.py. На выходе был получен файл, состоящий из колонок с номерами гармоник, амплитудами гармоник и фазами гармоник.

Ниже рассматривается восстановление функции электронной плотности по амплитудам и фазам в полном наборе гармоник без шума.
Набор гармоник ряда Фурье называется полным, если известны все гармоники с номерами 0, 1, 2, ..., n. Мной были рассмотрены наборы гармоник с n = 1, 10, 20, 25, 30, 35, 40. Результаты восстановления показаны на гифке 3.2.

Для всех дальнейших экспериментов заполнялась таблица (ссылка на скачивание), в которой были посчитаны/заданы разрешения, полнота, шум амплитуды (при его наличии), шум фазы (при его наличии) и качества восстановлений ЭП для данного набора гармоник.

Для оценки качества восстановления функции ЭП для данного набора гармоник были использованы критерии качества:
Отличное восстановление – по графику восстановленной функции можно определить положение максимума всех гауссовых слагаемых функции ("атомов")
Хорошее восстановление – можно угадать положение всех максимумов, зная число слагаемых ("атомов"), хотя на восстановленной функции максимумы от атомов не отличимы от шума
Среднее восстановление – положение каких-то атомов определить по восстановленной функции нельзя, других - можно
Плохое восстановление – положение атомов определить не представляется возможным; можно только предсказать примерный размер "молекулы"

plot

Гифка 3.2. Восстановление функции электронной плотности по полным наборам гармоник. n - гармоника с наибольшим номером.

Можно сказать, что при n = 1..10 качество восстановления электронной плотности плохое, при n = 20 - среднее, при n = 25 - хорошее, а при n = 30..40 - отличное! Таким образом, при используемых нами значениях, можно сказать, что n = 30 - это минимальный номер гармоники, при котором обеспечивается отличное восстановление ЭП по полному набору гармоник.

Далее проводилось восстановление электронной плотности по амплитудам и фазам по полному набору гармоник с добавлением шума к амплитуде.
Для этого функцию ЭП раскладывали в ряд Фурье с добавлением с амплитуде шума от 0% до 50% с шагом в 10%. Электронная плотность восстанавливалась по полному набору гармоник с n = 30. Результат приведен на гифке 3.3 ниже.

plot

Гифка 3.3. Восстановление функции электронной плотности по полному набору гармоник с n = 30 c добавлением шума различного уровня к амплитуде (от 0% до 50%).


При увеличении значений F, пики атомов, особенно с малым количеством электронов, становятся практически не отличимы от шума, который приобретает все большую амплитуду. Нужно отметить, что при F = 10%..20% качество восстановления ЭП все также остается отличным, при F = 30% - качество падает до хорошего, а при F = 40%..50% - до среднего.

Далее проводилось восстановление электронной плотности по амплитудам и фазам по полному набору гармоник с добавлением шума к фазе. Для этого функцию ЭП раскладывали в ряд Фурье с добавлением к фазе шума от 0% до 50% с шагом в 10%. Электронная плотность восстанавливалась по полному набору гармоник с n = 30. Результат приведен на гифке 3.4 ниже.

plot

Гифка 3.4. Восстановление функции электронной плотности по полному набору гармоник с n = 30 c добавлением шума различного уровня к фазе (от 0% до 50%).


Можно заметить, что добавление шума к фазе значительно снижает качество восстановления электронной плотности. При P = 0%..10% качество можно назвать отличным даже при том, что происходит едва заметный сдвиг положения пиков. При P = 20% качество хорошее, при P = 30%..40% - среднее, так как мы можем определить положение некоторых пиков, тогда как остальные пики подвергаются сильному смещению и/или уменьшению амплитуды. При Р = 50% качество становится откровенно плохим и определить положение атомов становится невозможно. Из приведенных выше экспериментов можно сделать вывод, что добавление шума к фазе гораздо более критично, чем добавление шума к амплитуде.

Далее проводилось восстановление электронной плотности по амплитудам и фазам по неполному набору гармоник. Для начала была удалена гармоника с n = 0, и было проведено восстановление по 1..30 гармонике. Предполагается, что удаление первых гармоник не сильно отразится на качестве восстановления ЭП. Результат приведен на рисунке 3.5 ниже.

plot

Рисунок 3.5. Восстановление функции электронной плотности по неполному набору гармоник c 1 по 30.


Можно заметить, что весь график функции сдвинулся вниз по ОУ, однако пики остались на месте и качество восстановления осталось отличным. В качестве разрешения для неполного набора гармоник c 1 по 30, была взята гармоника n = 30.
Далее была удалена и гармоника с n = 1. Результат приведен на рисунке 3.6 ниже.

plot

Рисунок 3.6. Восстановление функции электронной плотности по неполному набору гармоник c 2 по 30.


Можно заметить, что график как-будто проседает посередине, качество восстановления ЭП становится хорошим, так как амплитуда 3его атома едва ли отличима от шума. Далее проводилось восстановление электронной плотности по амплитудам и фазам по неполному набору гармоник, однако были убраны гармоники не из начала, а несколько гармоник из середины с номерами n = 15, 16.
Предполагается, что качество восстановления будет тем хуже, чем больше номера удаленных гармоник. Полученный результат приведен на рисунке 3.7 ниже.

plot

Рисунок 3.7. Восстановление функции электронной плотности по неполному набору гармоник c 0 по 14 и с 17 по 30.


Качество восстановления ЭП стало хуже, но по-прежнему хорошее (едва ли не среднее). В качестве разрешения для неполного набора гармоник с 0 по 14 и с 17 по 30 было взято разрешение 20ой гармоники.
Далее к этому же набору гармоник была добавлена 40вая гармоника, однако график функции ЭП совершенно не изменился (рисунок 3.8). Предполагается, что добавление старших гармоник, которое является скорее уточнением уже точной модели гораздо менее значимо по сравнению с вкладом срединных гармоник. В качестве разрешения для неполного набора гармоник с 0 по 14 и с 17 по 30, и 40 было взято разрешение 20ой гармоники, так как полученная ЭП недостаточно высокого качества и разрешение не может считаться по гармонике с наибольшим номером.

plot

Рисунок 3.8. Восстановление функции электронной плотности по неполному набору гармоник c 0 по 14 и с 17 по 30, и 40.




Сайт находится на этапе разработки.


© Бруман Софья, 2020