Учебная страница курса биоинформатики,
год поступления 2009
Занятие 4
Продолжение задания 3, п.3.
К 6 ноября необходимо подготовить отчет о качестве расшифровки, особенностях структуры и др. (см. ниже) для своей записи PDB. В задании 3 описано как поступить, если нет статьи или о вашей структуре (по нашему недосмотру) нет сведений на сайте EDS.
Отчёт можно оформить в HTML или DOC; в последнем случае на вашей странице семестра должна быть ссылка на него.
Отчёт должен быть построен по схеме, принятой для научных статей, то есть включать:
название типа “Критический анализ модели белка <эн-синтазы опоссума>, представленной в банке PDB, код <1XYZ>”;
- фамилию, инициалы и место учёбы автора;
аннотацию, примерно такую: “В отчете приведены результаты анализа качества структуры [название белка или комплекса], расшифрованной методом РСА [тогда-то, такими-то] и содержащимся в PDB под кодом [таким-то]. Выявлено, что [самое показательное из того, что удалось выявить];
введение, содержащее:
- описание белка и его функции (коротко);
- основной биологический результат статьи авторов расшифровки (коротко) и ссылку на эту статью;
результаты, включающие:
- общую информацию о модели:
- состав комплекса,
- год,
- фамилии авторов,
- метод решения фазовой проблемы,
- число измеренных рефлексов,
- разрешение, в том числе минимальное и максимальное разрешение для использованных рефлексов (всегда указано на странице EDS),
- процент использованных рефлексов относительно всех возможных рефлексов с разрешением ниже разрешения структуры в целом,
- наличие некристаллографических симметрий в асимметрической ячейке;
- значения R-фактора и свободного R-фактора и свои выводы;
- анализ выдачи программы PROCHECK, в том числе копию карты Рамачандрана и процент остатков (отличных от Gly и Pro), попавших в предпочитаемые области на карте, а также свои выводы;
- значения других глобальных индикаторов, смысл которых вам ясен;
- список нескольких (5–7, не более!!!) маргинальных остатков (или гетеромолекул). Каждый из маргинальных остатков может быть выделен по одному или нескольким из следующих признаков:
- плохие значения пространственного R-фактора (RSR),
- из запрещённой по Рамачандрану области,
- с неблагоприятным окружением,
- с неблагоприятной конформацией боковых цепей,
- с подозрением на инверсию (для His, Asn или Gln),
- молекула воды, постоянство положения которой в кристалле не имеет удовлетворительного объяснения.
- общую информацию о модели:
Заключение – обсуждение следующих тем:
- Общее качество модели: о чём свидетельствуют глобальные индикаторы качества, а также число и анализ маргиналов. В частности, есть ли подозрение на “переоптимизацию” (overfitting) модели?
- Краткий обзор протокола WHAT_CHECK для данной структуры.
- Какие участки пептидной цепи, групп атомов вызывают наибольшее подозрение?
- Ваш (обоснованный) вывод о вручную проанализированных маргинальных остатках: это скорее ошибки расшифровки (отщепенцы) или особые остатки (белые вороны)?
- Насколько обоснован биологический вывод авторов статьи; не использованы ли подозрительные в отношении правильности расшифровки данные для обоснования вывода?
Литературу (ссылку на статью и другие источники – если использовались).
Мы перечислили много пунктов. Они носят рекомендательный характер; ваша задача — выбрать и описать самое интересное в структуре. Пожалуйста, не увлекайтесь буквальным выполнением каждого пункта, тем более, копированием всего из протоколов проверки!
Лучше меньше, да лучше!
Некоторые указания
Программа PROCHECK доступна со страницы структуры в PDBSum (гиперссылка "PROCHECK" в правом верхнем углу). Скопируйте карту Рамачандрана и включите её в отчёт (не забыв добавить ссылку на источник и свой анализ).
На сервере EDS зайдите на страницу своей структуры. Сервис EDS сообщает основные глобальные индикаторы. Кроме того, он: а) позволяет скачать карты электронной плотности (а также анализировать их on-line viewer’ами, что не описано в данных указаниях); б) дает информацию о пространственном R-факторе (RSR) для всех остатков. Пройдите по гиперссылке "Significant regions" и обратите внимание на остатки, которые имеют большой Z-score по RSR – это потенциальные маргиналы. Для одного из этих остатков создайте изображение, на котором была бы видна его модель и электронная плотность вокруг него. Приведите значения пространственного R-фактора (RSR), коэффициента корреляции для электронной плотности ("real-space correlation coefficient") и Z-score пространственного R-фактора для этого остатка.
На сайте http://swift.cmbi.ru.nl/gv/pdbreport/ введите PDB-код и рассмотрите выдачу программы WHAT_CHECK. Определите, какую полезную для исследователя данной структуры информацию можно из неё извлечь. Читайте внимательно! В протоколе приведены как маргинальные группы атомов по разным индикаторам, так и пороги значений индикаторов. Объяснения параметров найдёте в самом протоколе, а также по ссылкам на документацию, указанным на сайте.
В частности, неблагоприятные конформации боковых цепей ищите под заголовком "Unusual rotamers"; информацию о неблагоприятном окружении – под заголовком "Packing, accessibility and threading" (прежде всего подраздел "Abnormal packing environment for some residues"); об инверсиях – "HIS, ASN, GLN side chain flips" и т.п. Другие подразделы тоже имеет смысл прочитать и понять!
Дополнительно можно включить в отчёт информацию, доступную на сервере PDB_REDO. Для этого со страницы своей структуры в EDS пройдите по гиперссылке "PDB_REDO". Изучите таблички "R-values" и "WHAT_CHECK validation" и опишите в отчёте, какие показатели у оптимизированной ("Fully optimised") структуры улучшились, а какие нет. Скачайте оптимизированную структуру и попробуйте выяснить, чем она отличается от исходной. В частности, стал ли какой-либо из исследованных вами маргиналов менее маргинальным (например, лучше вписываться в электронную плотность)?
Общие замечания по оформлению отчета
(1) В отчете ценится логичность изложения, а не обилие приведенных данных.
(2) Раздел ”Маргинальные остатки/гетеромолекулы“ служит для того, чтобы выбрать в итоге 5–7 наиболее подозрительных остатков/геторомолекул, не пропустить какие-либо вопиющие ошибки. Мы ожидаем, что вы посмотрите на все перечисленные списки маргиналов, но нет необходимости включать все списки в отчет – он перестаёт быть интересным и читаемым из-за обилия деталей! Одна-две фразы часто лучше объясняют ситуацию, чем таблицы, вывод из которых оставлен на усмотрение читателя. В предыдущие годы некоторые студенты собирали списки маргиналов в рабочий файл в Excel, что было им удобно для поиска маргиналов по многим параметрам. Это было удобно и для читателя. В таком случае в отчет можно вставить раздел ”Сопроводительные материалы”, в котором указать имя и координаты файла, а в тексте отчета привести только выводы по этим таблицам.
(3) Составление научного текста – дело творческое. Поэтому не возбраняется что-то пропустить, что-то добавить и т.п., если это оправдано спецификой материала.
(4) При разборе маргинального остатка следует включать рисунки, демонстрирующие, почему остаток маргинален. Так, например, если в протоколе What_Check сказано, что остаток маргинален по комфортности окружения, то хотелось бы видеть, что именно не так в этом окружении (а не что-то другое). В частности, электронную плотность для такого остатка следует приводить, только если вы обосновываете правильность расшифровки: дескать, да, окружение не очень приятное, но электронная плотность однозначно свидетельствует, что расшифровка правильная, и значит, маргинальность в данном случае говорит об особенности белка.