Валидация

Задание 1.

Мне была дана структура с PDB ID 1LF2 плазмепсина II с ингибитором RS370. Плазмепсин II является одним из четырех каталитически активных плазмепсинов, обнаруженных в пищевой вакуоли Plasmodium falciparum. Плазмепсин II, первый белок простейшего паразита рода Plasmodium, для которого была определена структура, представляет собой аспарагиновую протеазу, участвующую в деградации гемоглобина. Различные виды плазмоцитов являются этиологическими возбудителями малярии, разрушительной болезни человека, поражающей несколько сотен миллионов человек в год и убивающей, по оценкам, два миллиона из них, в основном детей. Виды плазмодия, такие как P. falciparum и P. vivax, вызывают заболевание во внутриэритроцитарной фазе малярии. Во время этой фазы паразит потребляет почти весь гемоглобин хозяина для выработки аминокислот для своего роста и созревания.Эти ферменты инициируют деградацию гемоглобина путем расщепления [альфа]-цепи между Phe33 и Leu34. Были идентифицированы ингибиторы фермента, которые имеют низкие значения константы наномолярного ингибирования и являются смертельными против культивируемых малярийных паразитов. Структура комплекса PLM II из P. falciparum представлена с новыми ингибиторами. Поскольку ингибиторы имеют ядро Phe±Leu, они дают представление о возможной конфигурации фермента при связывании природного субстрата гемоглобина. Оригинальная статья

Проанализируем метрики,характерные для данной структуры, все они находятся в красной зоне, что не очень хорошо:

Рис.1 Для каждой метрики определено два значения:процентильный ранг записи в
сравнении со всем архивом pdb и ранг в сравнении с записями, определенными
тем же экспеиментальным методом. Чем ближе показатель к голубой области, тем лучше.

Разрешение данной структуры равно 1.80 Å, а полнота равна 85.9%. Восстановление не очень хорошее из-за невысокой полноты, разрешение при этом довольно хорошее.

R-Value Free: 0.258 и R-Value Work: 0.195. Значение R фактор показывает, насколько хорошо смоделированная дифракционная картина соответствует экспериментально наблюдаемой дифракционной картине. Значение R-free Больше 20%, что не очень хорошо.Но сама разница между факторами меньше 10%, это говорит о том, что переоптимизации не наблюдается.

Clashscore - показатель столкновений всех атомов, определяется как количество столкновений, найденных на 1000 атомов (включая атомы водорода). После доабвления 2532 атомов водорода MolProbity появилось 68 таких наложений. Значение показателя стало ровняться 13 (1.3% атомов).

Было проанализирована конформация 99% остатков фермента. 93% из них лежат в предпочитаемой области. Такой процент говорит о том, что модель хорошая по данному показателю. 7% являются маргиналами, из которых 5% лежат в допустимой области, а 2% являются аутлаерами.

Если смотреть на конформацию боковых цепей остатков, то можно сказать чтоздесь процент аутлаеров выше (5%), это соответствует 15 остатком. Показатель %маргинальных остатков для всей структуры довольно хороший. Для данной метрики были проанализированы все остатки модели.

RSR - пространственный R-фактор, который сравнивает соответствие электронной плотности модели и “экспериментальной” электронной плотности. RSRZ - относительная оценка RSR для конкретного остатка. Хорошим значение RSRZ считается, если оно меньше 2-х. Плохие значения даны для 22 остатков структуры(6%).

Ниже представлена струткура фермента вместе с изображением электронной плотности. Можно сказать, что участки неопределенные, с неподтвержденой электронной плотностью расположены на поверхности белка. Вероятно они не являются сущетвенно значимыми для белка. К примеру, одиними из самых важных аминокислотных остатков являются те, что относятся к активному сайту. Согласно Uniprot, это остатки 158 и 338. Они эквиваленты двум остаткам: Asp'34 и ASp'214. Элетронная плотность данных остатков определенна для всех атомов.

Рис.2 Структура 1LF2; carve = 1.2, mesh = 1

Задание 2.

В задании необходимо проанализировать качество модели 1LF2. молекул воды или ионов, являющихся маргинальными по различным показателям качества. Для этого я выбрала 5 остатков, отличающихся по причинам их маргинальности. Для анализа были выбраы данные MolProbity и PDB.

Боковая цепь лизина имеет 4 степени свободы. Соответственно она имеет 4 торсионных угла. Ротамеры - это типичны конформации боковых цепей остатков. В данном задании изучаются маргиналы- нетипичные остатки по типу конфомации боковых цепей. Примером маргинала является Lys'327. Его углы, согласно MolProbity, равны: 301.2,106.7,54.1,210.6. Это нестандартные значения для углов. Изображение ниже подтверждает, что с аминокислотным остатком и его структурой что-то не так. Часть остатка не вписана в электронную плотность и из-за этого ему могли быть присвоены неверные углы. При этом остаток находится в петле на поверхности фермента, что вполне может являться причиной недоопределенности его строения. В PDB файле аминоксилотный остаток отмечен как аутлаер по критерию боковых цепей белков.

Рис 3. Lys'327, маргинал по критерию "боковые цепи"; carve = 1.4, mesh = 1.

Другой пример маргинала это Ile'277.Торсионные углы его полипептидной цепи являются нетипичными для данного остатка. Они равны, согласно MolProbity: 79.0,107.0. Если посмотреть на карту Рамачандрана для φ и ψ изолейцина и валина, это единственный остаток данной модели, который лежит далеко от предпочитаемой области торсионных углов.
Рис 4. Карта Рамачандрана для изолейцина 277.

И в MolProbity и в PDB отмечены наличие 5 аутлаеров по критерию торсионных углов для фермента. Одним из них является изолейцин. Если посмотреть на электронную плотность остатка, можно заметить, что даже при низком уровне mesh и высоком значении carve, она не покрывает значительную часть остатка. Это может влиять на неточность определения торсионных углов.

Рис 5. Ile'277, маргинал по критерию "Торсионные углы"; carve = 2, mesh = 1.

По критерию "длины связи" MolProbity обнаружил 2-х маргиналов. Один из них является Met'286. У него возникает нетипичная связь SD--CE. Если посмотреть на рисунок, можно увидеть, что конец боковой цепи остатка выходит за электронную плотность, и вероятно это влияет на нехарактерную длину между двумя атомами.

Рис 6. Met'286, маргинал по критерию "длина связи". carve = 1.5, mesh = 1.

Ниже лежащие маргиналы были найдены после добавления водородов к структуре. Программа вывела новые маргиналы по критерию Clashscore. Он отображает перекрывания в остатках. Одним из таких примеров служат остатки His'200 и Ile'204. И MolProbity, и PDB отметил наличие перекрывания в атомах O и CD2 на 0.56 Å. Расстояние между атомами равняется 2.6 Å.

Рис 7. His'200, Ile'204, маргиналы по критерию Clashscore.

Также MolProbity обнаружил 10 инверсий His/Asn/Gln. К примеру, 151 Asn нуждается в небольшом повороте по расчету программы. Если посмотреть на остаток в Pymol, можно предположить, что небольшой его поворот приведет к прочной водородной связи между азотом и кислородом остатков Gly'171 и Asn'151.

Рис 8.Gly'171 и Asn'151; маргинал Asn'151, который являвется инверсией.

Задание 3.

Плазмодий является возбудителем малярии. В ходе зазаболевания паразит потребляет практически весь гемоглобин хозяина для выработки аминокислот для своего роста и развития. Гемоглобин разлагается протеазами. Ингибиторы протеаз могли бы обеспечить целый ряд новых противомалярийных препаратов для решения проблем широко распространенной лекарственной устойчивости, с которыми сталкиваются современные методы лечения. Струткура 1LF2 с новыми ингииторами была создна авторами для изучения конфигурации фермента в момент его связывания с гемоглобином. По моему мнению, для цели изучения связывания игибиторов с ферментом данная модель хорошо подходит. Можно посмотреть на изображения ключевых остатков и заметить, что они, как и лиганд, вписаны довольно здорово в электронную плотность струткуры. Можно сказать что эта часть модели расшифрована очень хорошо. Маргиналы в структуре имеются, их довольно много, но они не влияют на предмет исследования. Если изучть структуру в MolProbity с использованием "View in NGL" после добавления водородов, видно, что большинтво маргинальных остатков торчат наружу от глобулы, либо являются молекулами воды. Соответственно они не являются функционално важными.

Рис 9. Электронная плотность ингибитора Рис. 10 Электронная плотность и водородная связь с лигандом активного сайта Asp34 и Asp214.

Рис 11. Электронная плотность и водородная связь с лигандом остатков Val78 and Ser79. Рис 12. Электронная плотность и водородная связь с лигандом остатка Gly36.

Задание 4.

PDB-REDO - это банк данных, который содержит оптимизированные версии существующих записей банка PDB с картами электронной плотности, описанием изменений модели и множеством данных проверки модели. Ссылка на структуру 1FL2:

1LF2

PDB-REDO улучшил R и R-free факторы. Первоначальные значения были равны 0,2408 и 0,2777 соответственно. После оптимизации факторы стали ровняться 0,1737 и 0,2112. Значение R-free фактора стало меньше 20, а это показатель хорошей модели. По критерию "ротамеры" были значительно изменены 19 остатков, 58 молекул воды были удалены, и по оценке банка данных 157 остатков стали лучше подходить по плотности. По карте Рамачандрана произошли изменения в остатках, которые перешли из допустимой и разрешенной областей в предпочитаемую. Это тоже говорит об улучшении модели. Некоторые аутлаеры стали принадлежать допустимой области, некоторые незначительно изменились:

Рис 13. Карта Рамачандрана с отражением остатков PDB(синие) и PDB-REDO(оранжевые).

Я загрузила структуру "Re-refined and rebuilt structure" и совместила ее с моделью PDB 1LF2. Значительные изменения коснулись некоторых петель, бэта-листов и альфа-спиралей. В некоторых местах расположение остатков сильно отличается от версии PDB:

Рис 14. PDB - голубая модель, PDB-REDO - желтая.

PDB Redo значительно улучшил качество вписанности в плотность для остатка ASP`162. Видно, что электронная плотность хорошо ложиться на остаток, изобраенный желтым цветом. В банке данных нет ни одного остатка, который бы значительно ухудшил свое качество. Наиболее тенденция к худшей оптимизации наблюдается у Val'280. До работы банка даных PDB-REDO остаток был плохо вписан электроную плотность. Оптимизация это не исправила:

Рис 15. Asp'162, желтым цветом изображен оптимизированный остаток. Рис 16. Val'280, желтым цветом изображен оптимизированный остаток.

4 из 6 маргинальных остатка, рассмотренных мною во втором задании, значительно улучшили свое качество вписанность в электронную плотность. При загрузке новой структуры в MolProbity было предложено для инверсии всего два остатка, это меньше, чем было в изначальной млдели. По критерию "длины связи" MolProbity изначально обнаружил 2-х маргиналов. Одним из них являлся Met'286. У него возникала нетипичная связь SD--CE. После оптимизация эта связь стала лучше вписываться в электронную плотность и перестала быть аутлаером. По данному критерию аутлаеров не осталось вообще:

Рис 17. Электронная плотность остатка Met'286; PDB - голубая модель, PDB-REDO - желтая.

Боковая цепь лизина имеет 4 торсионных угла. В модели PDB маргиналом являлся Lys'327. Его углы, согласно MolProbity, были равны: 301.2,106.7,54.1,210.6. В PDB файле аминоксилотный остаток отмечен как аутлаер по критерию боковых цепей белков. После улучшения структуры данный остаток больше не является маргиналом. На изображении видно, что хоть часть плотности также продолжает отсутствовать, остаток приобрел более естественное положение и более часто встречающиеся углы. Маргиналы His'200 и Ile'204 были найдены в MolProbity после добавления водородов к структуре. Программа вывела маргиналы по критерию Clashscore. MolProbity и PDB отметили наличие перекрывания в атомах O и CD2 на 0.56 Å. Расстояние между атомами равняется 2.6 Å. После оптимизации такая проблема исчезла. На изображении видно, что остаток гистидина был повернут. Вероятно меньшие орбитали перестали перекрываться.

Рис 18. Электронная плотность остатка Lys'327, желтым цветом изображен оптимизированный остаток. Рис 19.Электронная плотность остатков His'200 и Ile'204, желтым цветом изображены оптимизированные остатки.

Два других рассмотренных мною маргинала не сильно изменили свое положение, один из них так и сотался маргиналом, другому хватило незначительных изменений, чтобы больше не нуждаться в инверсии. Посмотрев на NGL модель можно сказать, что в разы убавилось количество остатков, расположенных на поверхности глобулы, которые являлись маргинальными. Из логических соображений можно предположить, что такая струткура лучше подойдет для изучения.

© Кирпиченко Алина, 2021