Prody - это библиотека, позволяющая быстро анализировать структуры биомолекул. Нам было предложено использовать Prody для краткого анализа B-фактора структуры 7avz, соответствующей тирозинкиназному домену Mer-киназы.

Задание 1

B-фактор - параметр атома, характеризующий неопределённость его электронной плотности. В файле PDB содержится информация о B-факторах атомов. Нам требуется найти аминокислотные остатки с самым низким и самым высоким средним B-фактором.

Вот остаток с наименьшим B-фактором. Ala-708 располагается внутри глобулы в окружении гирофобных остатков, сложенных в альфа-спирали. Такая структура очень устойчива. min_bf_res_sticks.png

Благодаря плотной упаковке окружения и его гидрофобности остаток лишен не только свободы передвижения, но и доступа воды. min_bf_res_sph.png

Остаток Ser-661 обладает самым высоким средним B-фактором. Он располагается снаружи глобулы и смотрит в раствор, то есть полностью сольватирован. ЭП радикала этого остатка не отображается уже на уровне подрезки 1. Видно, что у соседей остатка ЭП радикалов тоже весьма слабая. max_bf_res.png

Интересно посмотреть на разброс значений B-факторов атомов этих остатков. Как показано ниже, у остатка с высоким B-фактором (Ser-661) очень высокое стандартное отклонение B-фактора. У атомов этого остатка B-фактор сильно отличается: самые низкие значения - у азота аминогруппы и кислорода CО-группы остова, а у остальных - достаточно высокие. max_bf_std.png

Напротив, у остатка с самым низким значением среднего B-фактора (Ala-708) разброс его значений небольшой.

Задание 2

Нам было предложено построить график зависимости среднего B-фактора остатков от его расстояния до центра массы белковой структуры.

На графике выстраивается отчётливый тренд к росту B-фактора остатков с удалением от центра масс. Вероятно, есть смысл говорить о такой зависимости: чем дальше от центра масс, тем, если представить белковую глобулу в очень грубом приближении шаром, ближе к поверхности глобулы, контактирующей с раствором. Кроме того, что эти остатки могут принимать множественные положения из-за действия растворителя, они еще и не стабилизированы окружением. Кроме того, как мы выяснили в практикуме 2, у остаткаов с высоким B-фактором есть склонность входить в состав неструктурированных фрагментов. Однако не все так просто: некоторые остатки, образующие вторичную структуру, обладают аномально высоким B-фактором; в свою очередь и не все остатки, расположенные близко к центру масс, имеют низкие значения параметра. В связи с этим предполагать сферическую модель сферы было бы крайне неосмотрительно.

Ниже представлены коэффициенты корреляции Спирмана (мера ранговой зависимости) и Пирсона (мера линейной зависимости) для зависимости B-фактора от рассояния до центра масс. Коэффициент Пирсона в 0.6 даёт некоторый повод подумать о линейной зависимости, но по графику для меня лично это неочевидно.

Нам было интересно придумать другую модель для нашей молекулы (которая и не молекула никакая на самом деле, а просто вырезанный домен тирозин-киназы). Можно упрощенно представить нашу белковую структуру (одна цепь) как две условно одинаковые суб-глобулы, соединённые перешейком примерно в центре масс. B-фактор, характеризующий подвижность, конечно, зависит от расстояния до центра масс, однако есть что-то еще, что влияет на него. Нам показалось, что имеет смысл такая же зависимость B-фактора от расстояния до центра масс глобулы, который принадлежит остаток. Это разумно, так как в центре суб-глобулы на остаток действют такие же стабилизирующие факторы, как и в центре глобулы. Как мы видели, линейная зависимость B-фактора от расстояния до центра масс немного сомнительна. Еще более сомнительна линенйная зависимость от расстояния до центра глобулы. Мы разбили структуру на две УСЛОВНЫЕ суб-глобулы "на глаз". 2sgl.png

Имеет смысл в этом случае рассмотреть зависимость B-фактора от расстояния в какой-то степени. Кроме того, есть какой-то базовый уровень B-фактора из-за собственной подвижности белка как единицы. На небольших расстояниях мы можем считать расстояния до центра масс и центра суб-глобулы независимыми.

model1.png

Попробуем проверить, насколько наша модель описывает данные.

По нашей модели B-фактор зависит от расстояния до центра масс все-таки нелинейно (в степени 1.7), а от расстояния до центра суб-глобулы - линейно (степень 1). Однако доверять такой модели, наверное, стоит с осторожностью, так как стандартные ошибки параметров очень большие.

Модель пыталась объяснить дисперсию при средних значениях расстояний до центра масс, но у нее все равно не получилось. Какие могут быть проблемы?

1. Некорректное разделение на глобулы - более того, размеры этих глобул не равны и это не было учтено.

2. Можно было бы учесть локальную плотность остатков при фиксированных расстояниях d1 и d2 (кольцо, плоскость которого параллельна плоскости, разделяющей глобулы).

Задание 3

Предлагалось придумать одномерную молекулярную систему и смоделировать эксперимент по расшифровке этой структуры. Необходимо было получить реалистичную функцию реальной электронной плотности системы. Смоделировать ЭП, получаемую в ходе эксперимента можно, разложив функцию на большое количество гармоник, и выбрав из них какое-то ограниченное их количество. Из фаз и амплитуд этих гармоник получается "экспериментально полученная" функция ЭП.

Я решила сгенерировать функцию для системы "O2 + N3-". В азид-анионе заряд делокализован: электроны предпочитают находиться в области крайних атомов иона.

Функция ЭП была сгенерирована командой "python compile-func.py -g 8,2.9,6+8,2.9,7.21+7.9,3,17+6.2,3,18.15+7.9,3,19.3".

Разложение функции ЭП на гармоники было сделано командой "python func2fourier.py -i func_ox_and_az.txt" с ситуативным добалением параметров -F и -P - шум амплитуд и фаз.

Нужные гармоники выбирались вручную копипастой.

Получилось так: function.png

Далее были смоделированы эксперименты. Интервалы - это гармоники. Если гармоники не указаны, то интервалом считать 0-25. All_figures.png

Какие выводы можно сформулировать из выше сделанного?

1. При более высоком разрешении качество структуры лучше. (опыты 0 - 3)

2. Шум фазы гораздо сильнее затрудняет расшифровку ЭП, чем шум амплитуды. (опыты 4 - 6)

3. Необязательно бОльшая полнота данных означает лучшее качество: гораздо важнее присутствие первых гармоник (самого низкого разрешения). (опыты 7 - 10)