prac 4 Python для структур и не только

ЗАДАНИЕ1.

Сначала подключим необходимые библиотеки для расчетов.

А теперь загрузим информацию о пространственном расположении атомов нашего белка - гипотетического активатора секреции в возбудителе бруциллеза. С помощью пакета Prody определим какой остаток будет иметь максимальное, а какой минимальное, среди всех остатков, среднее по всем его атомам значение B-фактора (mean_beta). Нам интересено узнать, в каком участке белка каждый из этих остатков расположен и какие остаки составляют их окружение. Также посмотрим, есть ли разброс в значениях B-фактора для атомов интересующих нас остатков.

PHE 89 from Chain A имеет наименьшее среднее по атомам значение b-фактора. Оно равно 15.12. SER 173 from Chain A имеет наибольшее значение b-фактора. Оно равно 46.975.

Определим разброс значений B-фактора для атомов остатка PHE 89 (у него минимальная mean-beta-factor) и SER 173. Разброс для каждого остатка не превышает 5 единиц B-factor.

В контексте всей структуры белка, PHE89 находится между альфа-спиралями (см. рисунок ниже), в ядре белка. SER173 находится на поверхности белка и вероятно за счет полярного гидроксила образует водородные связи с окружением, увеличивая таким образом свою подвижность - а это причина иметь высокий B-factor.

В окружении PHE89 вся вода связана, поэтому она не вызывает колебаний этого остатка. Напротив, SER173 свободен для воды и может вступать с ней в связи и колебаться.

Приводим еще раз изображение белка, но теперь окрашенного по значению B-factor его остатков. Тут видно что серин лежит в петле - в самом подвижном из всех возможных элементов структуры.

2 TASK.

А сейчас представим на графике зависимость среднего B-factorа по атомам остатка нашего белка от расстояния между центром масс каждого остатка и центром масс всего белка.

Зависимости строгой мы не наблюдаем: остатки, которые расположены относительно далеко от центра масс белка, имеют всевозможные значения b-factor. Это значит, что есть другие факторы, нежели удаленность от центра, которые более прямо определяют B-фактор. Одним из них может быть тип вторичной структуры, на котором сидит рассматриваемый остаток. Если остаток будет в петле, то его B-фактор будет больше, чем у того, кто сидит на альфа-спирали.

3.Восстановление функции ЭП

Посмотрим на умозрительной одномерной модели, как потеря данных, полученных из эксперимента РСА, 

снижает качество восстановленной по ним функции ЭП и усложняет процесс ее интерпретации. Наша модель состоит из 2х молекул, в одной 3 атома, в другой 2. В идеальном случае мы бы восстанавливали функцию ЭП по 3000 рефлексам (точнее по их модулям и фазам структурных факторов). Но в ходе эксперимента мы не можем избавиться от ошибок в значениях модуля(F) и фазы (P) или от их потери, и имеем дело с меньшим числом рефлексов. На картинке ниже приведена серия восстановления функции ЭП по модулям и фазам, чьи значения отличаются от истинного не более чем на 5, 15, 30 процентов. Непрерывная желтая кривая здесь и далее соответсвует истинной функции. Темный пунктир есть экспериментально полученная функция. Вы можете видеть, что фазовый шум более критичен для качества функции, чем модульный шум. Удивительно, но шум от фазы гасится шумом модуля. По-моему это обстоятельство не было оставлено без внимания при реализации комбинированного синтеза Фурье.

Мы рассматриваем простую модель, что нам хватает 40+1(если нулевую тоже учитывать) гармоник, чтобы успешно восстановить функцию ЭП. Разрешение равно (30)/(40+1)=0.732 A. Надо сказать, что уже 10+1 гармоник достаточно, чтобы назвать восстановлением среднего качества. Хорошим оно будет при 20+1 использованных гармониках.

Узнаем, как восстановится функция по неполному набор гармоник. 
Левая картинка получилась по набору, где не хватало

первых 2 гармоник. Сигналы видны хорошо, а широкий колокол на 20 A нам не мешает интерпретировать функцию. Средняя картинка получится, если из полного набора из сорока гармоник пропадут 10% гармоник из середины. Теперь на 20A мы видим мелкие колоколы, которые можно спутать с сигналом. Если знать число молекул и число атомов в них, то восстановим мы функцию с хорошей оценкой, но без этого знания можно допустить ошибку. Если к этому неполному набору добавить 50ую гармонику, то получим правую картинку. Она похожа на среднюю, значит не имеют большого значения в восстановлении гармоники с номерами, большими номера, при котором восстановление по полному набору имеет отличное качество.

Приведем для рассмотренных примеров таблицу, где суммируем наши результаты.

Набор гармоник Разрешение (А) Полнота данных (%) Шум амплитуды (% от величины F) Шум фазы (% от величины P) Качество восстановления
Полный набор гармоник
0-40 0.732 100 5 0 отл
0-40 0.732 100 0 5 отл
0-40 0.732 100 5 5 отл
0-40 0.732 100 15 0 отл
0-40 0.732 100 0 15 отл
0-40 0.732 100 15 15 отл
0-40 0.732 100 30 0 отл
0-40 0.732 100 0 30 удовл
0-40 0.732 100 30 30 отл
0 30 100 0 0 неуд
0-1 15 100 0 0 неуд
0-5 5 100 0 0 неуд
0-10 2.7 100 0 0 удовл
0-20 1.43 100 0 0 хор
0-40 0.73 100 0 0 отл
Неполный набор гармоник
2-40 0.73 95.12 0 0 отл
0-18&23-40 0.73 90.24 0 0 хор
0-18&23-40&50 0.73 90.24 0 0 хор

При неполном наборе гармоник лучше выбирать такое азрешение, чтобы полнота данных была достаточно высока, в противном случае разрешение не будет соответсовать действительности.