Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2021

Задание 1

На этот практикум вам дана пара PDB ID (в ведомости), первый соответствует модели белка, полученной методом ЯМР, второй – методом РСА.

По структуре, полученной методом РСА, выберите 3 водородные связи:

В отчете приведите:

Задание 2

Запись в PDB, полученная методом ЯМР, представляет собой набор моделей, которые, по мнению авторов, являются лучшими "догадками" о реальной структуре. Как вы помните, это происходит из-за неполноты данных об ограничениях на расстояния и ковалентную связность, получаемых из эксперимента. В то время как эта неполнота может быть следствием подвижности, это не обязательно так, так как она также может быть вызвана шумом в данных и неидеальностью эксперимента.

Но предположим, что ансамбль моделей действительно отражает вариацию в позициях, которая появляется вследствие подвижности белка во времени. Мерой подвижности отдельных его участков (атомов, остатков, петель) является RMSF (root mean square fluctuation). В идеальном случае, если наш ансамбль в действительности представляет собой отражение эволюции системы во времени, по значениям RMSF атомов даже вычисляют значения B-факторов аналитически. Таким образом, у нас есть возможность грубо прикинуть, в какой мере ансамбль моделей в записи PDB, полученной методом ЯМР, действительно можно принять за отражение подвижности белка, взяв для сравнения значения B-факторов из модели РСА.

Для автоматизации работы со структурой будем использовать ProDy – библиотеку для python для парсинга файлов pdb и манипуляций с координатами. Туториал

С помощью Prody вычислите средние RMSF для остатков в модели ЯМР:

nmr_model = prody.parsePDB(...)
RMSFs = [numpy.mean(prody.calcRMSF(res)) for res in nmr_model.iterResidues()]

Также вычислите средние B-факторы для каждого остатка. Постройте scatter-plot зависимости одного от другого. Заметен ли какой-то тренд? Опишите его. Что он может значить?

Убедитесь, что значения в двух массивах попарно соответствуют одному и тому же остатку! Для этого до начала работы с ProDy изучите структуры в PyMol. Вы можете заметить, например, что в модели РСА есть более одной цепи – тогда для работы возьмите только одну. Также могут отсутствовать остатки с краев в одной или другой модели – тогда делайте соответствующие срезы массивов. В PyMol инструмент A > align создает объект aln_..., хранящий информацию о выравнивании последовательностей. Включив отображение последовательностей при активированном этом объекте, вы увидите, что последовательности моделей сопоставлены друг другу. Серым показаны отсутствующие остатки. Если у вас возникают затруднения, обращайтесь к преподавателям.

Задание 3* - на доп.баллы

Попробуйте сделать не примерное, а совершенно точное сравнение. В этой статье первой формулой приведено соотношение RMSF для атома с его B-фактором, по которому последний можно вычислить, имея реалистичный динамический ансамбль, полученный, например, из моделирования молекулярной динамики. Постройте scatter-plot зависимости квадрата RMSF каждого атома от его 3*B/(8 * pi^2). Чтобы взять только такие атомы, которые есть в обеих записях, и убедиться, что они сопоставлены верно, придется поработать. Не рассматривайте атомы водорода, а также обращайте повышенное внимание к концевым остаткам белка.

Построив scatter-plot, оцените, насколько он действительно соответствует приведенной в статье формуле. Сделайте выводы, опишите их.

2021/7/task6 (последним исправлял пользователь a.fokina 2024-12-04 15:10:15)