Практикум 3. Python для структур и не только
Задание 1. Prody и B-факторы часть 1
С помощью библиотеки Prody в в структуре 6AM7 (из практикума 2) были найдены остатки с максимальным и минимальным значением среднего B-фактора (и значения по атомам):
GLU 285 from Chain C from 6AM7 (9 atoms) -> 84.871
array([77.56, 81.51, 80.92, 82.8 , 86.65, 90.1 , 88.36, 87.97, 87.97])
разброс: 12.5
VAL 196 from Chain C from 6AM7 (7 atoms) -> 12.861
array([12.89, 12.83, 12.91, 12.9 , 12.81, 12.78, 12.91])
разброс: 0.13
Рис 1. Визуализация цепей и остатков VAL196 и GLU285 из структуры 6AM7 (слева направо).
Оба остатка являются частями петель, но GLU, имеющий максимальное среднее значение В-фактора, находится на внешней стороне белка. В целом он, вероятно, плохо разряжен, разброс значений у него существенно больше, чем у VAL, который хоть и находится на петле, но зажат между структурами белка в своеобразный "карман".
Задание 2. Prody и B-факторы часть 2
В данном задании нужно было вычислить для каждого остатка белка
средний B-фактор по его атомам и его центр масс.
Рис 2. Scatter plot зависимости B-фактора от расстояния до центра белка.
Из данных графика можно заметить, что распределение точек напоминает экспоненциальное, а еще сделать вывод, что зависимость между В-фактором остатка и расстоянием до центра белка можно описать таким образом: чем больше расстояние между остатком и центром белка, тем больше В-фактор.
Задание 3. Как работает восстановление функции электронной плотности по экспериментальным данным
run /Users/mariagrigoreva/Desktop/bioinf/1/compile-func.py -g 30,4,3+21,3,4.6+1,3,10+16,3,5.4+23,5,9.6+7,2.5,10.7
Электронная плотность исходной модели.
1) Полные наборы гармоник без шума (6 интервалов: 0-5, 0-10, 0-20, 0-30, 0-40, 0-50)
0-5
0-10
0-20
0-30
0-40
0-50
Качество восстановления функции ЭП в данном случае оставалось плохим до 0-20, однозначно определить положения атомов по ним было затруднительно. Начиная с 0-20 качество становится средним (и пики становятся похожи на пики). Под конец шум оказался минимальным. Таким образом, можно сделать вывод о том, что качество восстановления увеличивается с длиной интервала гармоник.
2) Восстанавление функции ЭП с зашумлением амплитуд (F = 10%, 50%, 75%) и/или фаз (P = 10%, 50%, 75%) по полному набору гармоник на интервале 0-40.
10%
50%
75%
Из рисунков выше видно, что в целом даже при высоком уровне шума амплитуды качество восстановления функции ЭП более-менее удволетворительное, на начальных этапах его можно даже назвать неплохим.
3) Варьирование уровня шума фазы.
10%
50%
75%
Начиная с 50% часть атомов начинает сливаться с шумом, для 75 качество продолжает понижаться. В целом можно сказать, что шум фазы сильнее портит прочтение, нежели амплитудный шум.
4) Комбо из шумов (Попарное варьирование).
P = 10%, F = 50%
P = 50%, F = 10%
При добавлении шума к фазам качество восстановления падает сильнее. Выводы предыдущего пункта подтверждаются - чем больше фазового шума, тем хуже картинка.
4) Восстановленные без шумов функции ЭП по различным неполным набором гармоник: 5-40 (88%), 0-9, 12-38 (92%), 0-31, 40 (78%).
Восстановление функции электронной плотности по неполному набору гармоник (5-40)
Восстановление функции электронной плотности по неполному набору гармоник (интервал гармоник: 0-9,12-38)
Восстановление функции электронной плотности по неполному набору гармоник (интервал гармоник: 0-31, 40).
Можно заметить, что удаление начальных гармоник вызывает сильное "проседание" пиков. Удаление центральных и смещенных к концу гармоник тоже оказывает свое влияние (часть пиков подвисли), но размах провисания соверенно не сопоставим.
Однако пики все равно хорошо различимы, шум практически не мешает.
© Grigorjeva Masha