Учебная страница курса биоинформатики,
год поступления 2020
Задание 1
На этот практикум вам дана пара PDB ID, первый соответствует модели белка, полученной методом ЯМР, второй – методом РСА.
По структуре, полученной методом РСА, выберите 3 водородные связи:
- между атомами остова в ядре белка (в альфа-спирали или бета-листе);
- водородную связь боковых цепей в ядре белка;
- водородную связь в петлях, выходящих на поверхность глобулы (неважно, какие атомы, остова или боковой цепи).
В отчете приведите:
- номера и типы остатков, между какими атомами водородная связь, каким элементам вторичной структуры принадлежат остатки, находятся ли они внутри глобулы или на ее поверхности;
- табличку расстояний между донорами и акцепторами с колонками:
- расстояние в РСА,
- в каком числе (и проценте) моделей ЯМР есть водородная связь,
- минимальное, максимальное и медианное значение расстояния в ЯМР (по всем моделям, не только по тем, где есть связь);
- Ваши выводы и рисунок(-ки) подтверждающие выводы.
Задание 2
Запись в PDB, полученная методом ЯМР, представляет собой набор моделей, которые, по мнению авторов, являются лучшими "догадками" о реальной структуре. Как вы помните, это происходит из-за неполноты данных об ограничениях на расстояния и ковалентную связность, получаемых из эксперимента. В то время как эта неполнота может быть следствием подвижности, это не обязательно так, так как она также может быть вызвана шумом в данных и неидеальностью эксперимента.
Но предположим, что ансамбль моделей действительно отражает вариацию в позициях, которая появляется вследствие подвижности белка во времени. Мерой подвижности отдельных его участков (атомов, остатков, петель) является RMSF (root mean square fluctuation). В идеальном случае, если наш ансамбль в действительности представляет собой отражение эволюции системы во времени, по значениям RMSF атомов даже вычисляют значения B-факторов аналитически. Таким образом, у нас есть возможность грубо прикинуть, в какой мере ансамбль моделей в записи PDB, полученной методом ЯМР, действительно можно принять за отражение подвижности белка, взяв для сравнения значения B-факторов из модели РСА.
Для автоматизации работы со структурой будем использовать ProDy – библиотеку для python для парсинга файлов pdb и манипуляций с координатами. Туториал
С помощью Prody вычислите средние RMSF для остатков в модели ЯМР:
nmr_model = prody.parsePDB(...) RMSFs = [numpy.mean(prody.calcRMSF(res)) for res in nmr_model.iterResidues()]
Также вычислите средние B-факторы для каждого остатка. Постройте scatter-plot зависимости одного от другого. Заметен ли какой-то тренд? Опишите его. Что он может значить?
Убедитесь, что значения в двух массивах попарно соответствуют одному и тому же остатку! Для этого до начала работы с ProDy изучите структуры в PyMol. Вы можете заметить, например, что в модели РСА есть более одной цепи – тогда для работы возьмите только одну. Также могут отсутствовать остатки с краев в одной или другой модели – тогда делайте соответствующие срезы массивов. В PyMol инструмент A > align создает объект aln_..., хранящий информацию о выравнивании последовательностей. Включив отображение последовательностей при активированном этом объекте, вы увидите, что последовательности моделей сопоставлены друг другу. Серым показаны отсутствующие остатки. Если у вас возникают затруднения, обращайтесь к преподавателям.
Задание 3* - на доп.баллы
Попробуйте сделать не примерное, а совершенно точное сравнение. В этой статье первой формулой приведено соотношение RMSF для атома с его B-фактором, по которому последний можно вычислить, имея реалистичный динамический ансамбль, полученный, например, из моделирования молекулярной динамики. Постройте scatter-plot зависимости квадрата RMSF каждого атома от его 3*B/(8 * pi^2). Чтобы взять только такие атомы, которые есть в обеих записях, и убедиться, что они сопоставлены верно, придется поработать. Не рассматривайте атомы водорода, а также обращайте повышенное внимание к концевым остаткам белка.
Построив scatter-plot, оцените, насколько он действительно соответствует приведенной в статье формуле. Сделайте выводы, опишите их.