Практикум 3. Python для структур и не только

Задание 1. Prody и B-факторы часть 1

С помощью библиотеки Prody в в структуре 6AM7 (из практикума 2) были найдены остатки с максимальным и минимальным значением среднего B-фактора (и значения по атомам):

GLU 285 from Chain C from 6AM7 (9 atoms) -> 84.871

array([77.56, 81.51, 80.92, 82.8 , 86.65, 90.1 , 88.36, 87.97, 87.97])

разброс: 12.5

VAL 196 from Chain C from 6AM7 (7 atoms) -> 12.861

array([12.89, 12.83, 12.91, 12.9 , 12.81, 12.78, 12.91])

разброс: 0.13

Рис 1. Визуализация цепей и остатков VAL196 и GLU285 из структуры 6AM7 (слева направо).

Оба остатка являются частями петель, но GLU, имеющий максимальное среднее значение В-фактора, находится на внешней стороне белка. В целом он, вероятно, плохо разряжен, разброс значений у него существенно больше, чем у VAL, который хоть и находится на петле, но зажат между структурами белка в своеобразный "карман".

Задание 2. Prody и B-факторы часть 2

В данном задании нужно было вычислить для каждого остатка белка средний B-фактор по его атомам и его центр масс.

Рис 2. Scatter plot зависимости B-фактора от расстояния до центра белка.

Из данных графика можно заметить, что распределение точек напоминает экспоненциальное, а еще сделать вывод, что зависимость между В-фактором остатка и расстоянием до центра белка можно описать таким образом: чем больше расстояние между остатком и центром белка, тем больше В-фактор.

Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным

run /Users/mariagrigoreva/Desktop/bioinf/1/compile-func.py -g 30,4,3+21,3,4.6+1,3,10+16,3,5.4+23,5,9.6+7,2.5,10.7

Электронная плотность исходной модели.

1) Полные наборы гармоник без шума (6 интервалов: 0-5, 0-10, 0-20, 0-30, 0-40, 0-50)

0-5

0-10

0-20

0-30

0-40

0-50

Качество восстановления функции ЭП в данном случае оставалось плохим до 0-20, однозначно определить положения атомов по ним было затруднительно. Начиная с 0-20 качество становится средним (и пики становятся похожи на пики). Под конец шум оказался минимальным. Таким образом, можно сделать вывод о том, что качество восстановления увеличивается с длиной интервала гармоник.

2) Восстанавление функции ЭП с зашумлением амплитуд (F = 10%, 50%, 75%) и/или фаз (P = 10%, 50%, 75%) по полному набору гармоник на интервале 0-40.

10%

50%

75%

Из рисунков выше видно, что в целом даже при высоком уровне шума амплитуды качество восстановления функции ЭП более-менее удволетворительное, на начальных этапах его можно даже назвать неплохим.

3) Варьирование уровня шума фазы.

10%

50%

75%

Начиная с 50% часть атомов начинает сливаться с шумом, для 75 качество продолжает понижаться. В целом можно сказать, что шум фазы сильнее портит прочтение, нежели амплитудный шум.

4) Комбо из шумов (Попарное варьирование).

P = 10%, F = 50%

P = 50%, F = 10%

При добавлении шума к фазам качество восстановления падает сильнее. Выводы предыдущего пункта подтверждаются - чем больше фазового шума, тем хуже картинка.

4) Восстановленные без шумов функции ЭП по различным неполным набором гармоник: 5-40 (88%), 0-9, 12-38 (92%), 0-31, 40 (78%).

Восстановление функции электронной плотности по неполному набору гармоник (5-40)

Восстановление функции электронной плотности по неполному набору гармоник (интервал гармоник: 0-9,12-38)

Восстановление функции электронной плотности по неполному набору гармоник (интервал гармоник: 0-31, 40).

Можно заметить, что удаление начальных гармоник вызывает сильное "проседание" пиков. Удаление центральных и смещенных к концу гармоник тоже оказывает свое влияние (часть пиков подвисли), но размах провисания соверенно не сопоставим.

Однако пики все равно хорошо различимы, шум практически не мешает.


© Grigorjeva Masha