Учебная страница курса биоинформатики,
год поступления 2019
Связывание лигандов. Карманы связывания. Индуцированное соответствие
Вам дано два PDB файла (запишитесь в таблицу), соответствующие свободной и связанной с лигандом форме некоторого белка. Соответственно называются они free.pdb и bound.pdb. В этом задании вам предстоит отработать ряд инструментов структурной биоинформатики и изучить, к каким изменениям в структуре белка приводит связывание лиганда.
Задание 1. Изменения
Изучите оба файла в PyMol. Локализуйте лиганд (он там гарантированно один). Опишите, какие изменения произошли с остатками, выстилающими карман связывания, с самой формой кармана. Почему, как вам кажется, они произошли? Какие взаимодействия стали выгоднее или вовсе появились впервые в связанной форме? Приведите минимум 3 примера, снабдите их иллюстрациями.
Постарайтесь идентифицировать наиболее критические изменения. Укорачивание водородной связи на 0.1 ангстрем таковыми не является (а наблюдаемое изменение расстояния и вовсе может быть следствием погрешности в построении модели). Образование новых взаимодействий, исчезновение каких-либо взаимодействий, движения остова петель белка относительно всей остальной части – вот на это стоит смотреть.
Сравните объемы полостей – той, что была в свободной форме, и той, что получается, если из связанной формы удалить лиганд. Какой смысл имеет второе число? Оно, в сравнении с первым, покажет вам, насколько "стянутым" оказались остатки белка, будучи скрепленными взаимодействиями через посредник-лиганд.
1.1. Создайте еще один файл pdb, например, bound_without_lig.pdb, в который сохраните только атомы белка из bound.pdb, без лиганда.
1.2. Воспользуйтесь веб-сервером ProteinsPlus, чтобы автоматически выделить полости в free.pdb и bound_without_lig.pdb. После сабмита файлов в правом меню выберите "DoGSiteScorer". Используйте параметры по умолчанию. Время выполнения расчета - 3 минуты.
Удалось ли программе найти полости, которые, на ваш взгляд, присутствуют в этой молекуле?
Альтернатива (очень быстрая и весьма наглядная) – https://durrantlab.pitt.edu/fpocketweb/
1.3. Нашелся ли карман связывания вашего лиганда в обоих случаях (free.pdb и bound_without_lig.pdb)? Каков объем этого кармана в обеих формах, как меняется объем кармана при связывании лиганда? Что это говорит в контексте "стягивания" остатков белка лигандом? Как вы думаете, это стягивание, если оно есть в вашем случае, происходит во время связывания или уже после того, как лиганд стабилизировал свое положение?
Картинки из сервиса можно сделать, найдя под левой панелью кнопку Screenshot и выбрав разрешение. В конце правой панели есть возможность скачать разметку сервиса в виде атомов остатков, выстилающих каждый карман. Таким образом можно сориентироваться, где они конкретно расположены (если привычнее работать в PyMol).
Задание 2. Докинг для имитации ранних стадий связывания лиганда
Попробовать ответить на этот вопрос можно, сымитировав ранние шаги связывания лиганда. Если лиганд имеет возможность образовать со свободной формой те же (или многие из тех же) взаимодействий с белком, которые у него есть в полностью связанной структуре, то наблюдаемые конформационные изменения это следствия связывания и происходят после него. Если же без изменений в структуре кармана связывание невозможно (мы не наблюдаем похожих взаимодействий), то без эффекта индуцированного соответствия не обойтись, а, значит, изменение конформации кармана происходит одновременно со связыванием.
Введение
Докинг – это метод молекулярного моделирования, применяющийся для определения позы и конформации лиганда в кармане связывания белка. Подавляющее большинство инструментов докинга очень быстрые и позволяют получить результат в пределах минуты на пару "лиганд-белок". Однако при этом они очень многим жертвуют. Так, остов белка всегда остается неизменным, и только лишь в отдельных случаях можно разрешить Монте-Карло перебор ротамеров боковых радикалов. Положение и конформация лиганда же всегда подвержена Монте-Карло перебору, и происходит генерация миллионов гипотез о том, как он может располагаться в таком "жестком" кармане связывания. После этого для каждой гипотезы рассчитывается некоторый эмпирический "скор", который должен выделить из всего созданного многообразия наиболее реалистичные позы. Они и являются выдачей программы.
Скор-функции инструментов докинга могут быть очень разными, но их объединяет назначение – максимизация вероятности того, что топ-1 поза будет соответствовать "реальной" из известного комплекса белок-лиганд в обучающей выборке. При этом попытки по значению скор-функции делать выводы об аффинности связывания в общем случае проваливаются – корреляции Пирсона с экспериментальными IC50 обычно в районе 0.3 для задач "один белок - много лигандов" и "много белков - много лигандов". Наш случай "один белок - один лиганд" является удачным исключением, и допустимо рассуждать с привлечением значения скор-функции как аргумента.
Задание
Мы воспользуемся докингом, чтобы сымитировать ранние стадии связывания лиганда с карманом связывания. Получается, что нам нужно провести докинг, взяв в качестве конформации белка free.pdb, а лиганд позаимствовав из bound.pdb. При этом, как было описано выше, мы не создадим биас стартового состояния для конформации лиганда, так как инструменты докинга генерируют большое разнообразие конформаций для лигандов, а не берут исходную.
2.1. Откройте bound.pdb в PyMol, выделите лиганд, сохраните в отдельный файл с расширением sdf. (save ligand.sdf, my_selection).
2.2. Зайдите на страницу DiffDock. В первом поле загрузите ваш файл белка (free.pdb) в формате pqb. В правое поле загрузите файл лиганда в формате sdf.
2.3. Выберите число итераций ниже. Если есть немного времени подождать, сделайте максимум (разница в несколько минут).
2.4. Нажмите Run predictions. Через несколько минут появится визуализация результатов и возможность скачать их, чтобы работать с файлами в PyMol.
Если ваш DiffDock падает с Error, то, возможно, ему не нравится форматирование pdb файла. А, именно, колонки с кодом сегмента (предпоследняя). Что делать –
В pymol загружаете free.pdb
alter free, segi='A'
save free.pdb, free
Так как все файлы для задания я дал уже исходно выровненными, сравнить положение лигандов в bound.pdb и в предсказаниях должно быть не сложно. Есть ли среди выдачи поза, похожая по положению на ту, что была в bound.pdb? Если нет, как вы думаете, почему?
2.5. Изучите более детально лучшую позу из выдачи. Постройте для нее визуализацию всех взаимодействий в PoseView. Сделайте то же самое для взаимодействий истинной позы в связанном состоянии (bound.pdb). Покажите обе диаграммы. Есть ли в них общие взаимодействия? Какие? Что это может значить в контексте процесса связывания лиганда с белком?
PoseView это один из инструментов в составе ProteinsPlus. После того, как загрузите белок и лиганд, найдите этот инструмент в правом меню.
Если подавать ProteinsPlus лиганд отдельно, то нужно это делать в формате sdf. PyMol умеет сохранять в этом формате. save lig.sdf, sele . Но удобнее для построения диаграммы взаимодействий сохранить комплекс белка с лигандом в один pdb файл.
Альтернатива (на случай повторной неработы ProteinsPlus) – https://www.playmolecule.com/PlexView/
О чем здесь стоит порассуждать
- Если есть общие взаимодействия, могут ли они быть первоначальными "якорями" в этом процессе? Задерживая диффундирующий мимо лиганд, тем самым инициируя замыкание дополнительных связей?
Насколько для вашей пары вероятен эффект индуцированного соответствия (induced fit)? Как подойти к ответу на этот вопрос – если и в свободной форме лиганд лег в карман относительно похоже на референсную позу, значит, все дальнейшие изменения с белком произошли вследствие этого связывания, то есть позже во времени. Это значит, что индуцированного соответствия нет, а есть вызываемые связыванием лиганда конформационные перестройки, которые могут иметь функциональное значение.
- Если же без изменения конформации белка похожей позы никак не получается, это может значить, что сам процесс связывания не может произойти без подстройки белка под лиганд, что и есть суть эффекта индуцированного соответствия.
Допы
Удалось ли PoseView найти все взаимодействия верно, или он где-то наврал?
Можем ли мы доверять DiffDock? Поставьте контроль, проведя докинг лиганда в bound.pdb и сравнив результаты с "правдой"
У нас на руках 2 разные конформации одного белка. Задача получения конформаций интересна по многим причинам, в частности, в драг дизайне. Можно ли получить эти две (а может еще какие-то) конформации с помощью ESMFold, проводя маскирование языковой модели (это аналог прореживания выравнивания для AlphaFold)? Поставьте эксперимент с помощью колаба. Опции, с которыми стоит поиграть, в разделе Sampling.
Связано ли изменение конформации с изменением вторичных структур? Сгенерируйте разметки с помощью STRIDE, сравните.