Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

ProDy-2. ЯМР vs РСА

На этот практикум вам дана пара PDB ID, первый соответствует модели белка, полученной методом ЯМР, второй – методом РСА.

Ваши PDB ID для этого практикума

Задание 1. Вводное

0.75 баллов

Приведите PDB коды, название белка, разрешение РСА, число моделей ЯМР.

Сделайте изображения моделей. Постарайтесь добиться того, чтобы была понятна разница между ними. Например, можно наслоить модель РСА на модели ЯМР (используйте команду super <xray object>, <nmr object>, например, или A > align > enabled to this) и показать и то, и другое в виде cartoon или ribbons. Покрасьте все модели ЯМР в один цвет, а РСА – в другой. Опишите их различия на макро-уровне (структура как целое, какие части более похожи, в каких наблюдаются максимальные различия) и на микро-уровне (отдельные остатки, химические группы). С какими особенностями методов связаны эти различия?

Задание 2. RMSF

1.25 баллов

Запись в PDB, полученная методом ЯМР, представляет собой набор моделей, которые, по мнению авторов, являются лучшими "догадками" о реальной структуре. Как вы помните, это происходит из-за неполноты данных об ограничениях на расстояния и ковалентную связность, получаемых из эксперимента. В то время как эта неполнота может быть следствием подвижности, это не обязательно так, так как она также может быть вызвана шумом в данных и неидеальностью эксперимента.

Но предположим, что ансамбль моделей действительно отражает вариацию в позициях, которая появляется вследствие подвижности белка во времени. Мерой подвижности отдельных его участков (атомов, остатков, петель) является RMSF. В идеальном случае, если наш ансамбль в действительности представляет собой отражение эволюции системы во времени, по значениям RMSF атомов даже вычисляют значения B-факторов аналитически. Таким образом, у нас есть возможность грубо прикинуть, в какой мере ансамбль моделей в записи PDB, полученной методом ЯМР, действительно можно принять за отражение подвижности белка, взяв для сравнения значения B-факторов из модели РСА.

С помощью Prody вычислите средние RMSF для остатков в модели ЯМР:

nmr_model = prody.parsePDB(...)
RMSFs = [numpy.mean(prody.calcRMSF(res)) for res in nmr_model.iterResidues()]

И, аналогично предыдущему практикуму, вычислите средние B-факторы. Постройте scatter-plot зависимости одного от другого. Заметен ли какой-то тренд? Опишите его. Что он может значить?

Убедитесь, что значения в двух массивах попарно соответствуют одному и тому же остатку! Для этого до начала работы с ProDy изучите структуры в PyMol. Вы можете заметить, например, что в модели РСА есть более одной цепи – тогда для работы возьмите только одну. Также могут отсутствовать остатки с краев в одной или другой модели – тогда делайте соответствующие срезы массивов. В PyMol инструмент A > align создает объект aln_..., хранящий информацию о выравнивании последовательностей. Включив отображение последовательностей при активированном этом объекте, вы увидите, что последовательности моделей сопоставлены друг другу. Серым показаны отсутствующие остатки. Если у вас возникают затруднения, обращайтесь к преподавателям.

+0.5 баллов

Попробуйте сделать не примерное, а совершенно точное сравнение. В этой статье первой формулой приведено соотношение RMSF для атома с его B-фактором, по которому последний можно вычислить, имея реалистичный динамический ансамбль, полученный, например, из моделирования молекулярной динамики. Постройте scatter-plot зависимости квадрата RMSF каждого атома от его 3*B/(8 * pi^2). Чтобы взять только такие атомы, которые есть в обеих записях, и убедиться, что они сопоставлены верно, придется поработать. Не рассматривайте атомы водорода, а также обращайте повышенное внимание к концевым остаткам белка.

Построив scatter-plot, оцените, насколько он действительно соответствует приведенной в статье формуле. Сделайте выводы, опишите их.

Задание 3.

1 балл

По структуре, полученной методом РСА, выберите 3 водородные связи:

В отчете приведите: