Оцена качества 3D структур


1. Поиск несоответствий в PDB файлах.


Модель 7GPB

Представленная в файле 7GPB модель изображает структуру гомотетрамера гликогенфосфорилазы и имеет разрешение 2.90 А.
Статья относится еще к 1991 году, а последние изменения датируются 2011 годом (поле REVDAT в файле .pdb),
однако, судя по записям на сайте PDB (поле Revision History), они не относились к изменению модели.

В модели 7GPB встречаются грувые с биологической точки зрения, ошибки, например Trp67 цепи D.
На Рис. 1 видно, насколько несвойственное положени занимают углероды в боковой цепи триптофана:
sorry
Рис. 1. Цепь D модели 7GPB с выделенными триптофанами. У триптофанов 67, 189 и 825 приведены
данные для атомов СА и СН2 в формате (остаток, номер, "температурный фатор" или "atomic displacement parameter").

Как видно из рисунка 1, температурный фактор цикле боковой цепи триптофана 67 цепи D значительно выше.
То есть, в данной области электронная плотность не имела острого пика, а была размыта. Тем не менее,
по-видимому, модель, которую использовали авторы в 1991 году, не учитывала необходимости планарности ароматических циклов,
поэтому предпочла расположить атомы в тех местах, где соответствие данным было бы наилучшим.
Выходит, химические законы пали жертвой недоработанной модели.

Хочется отметить, что по данным сайта PDBREPORT указано еще много проблемных моментов в структуре 7GPB,
но в поле Side chain planarity problems на первом месте стоит как неправильный именно триптофан 67 цепи D (среди других остатков немало триптофанов,
плюс аргинины, аспарагины и глутаматы, см ситуацию со структурой 1DLP ниже).


Модель 5RXN

Это модель структуры рубредоксина Clostridium pasteurianum, разрешение 1.20 А.
Структура была расшифрована в 1984-1985 годах, последние изменения в 2009 году (REVDAT).
В модели можно найти два диастереомера треонина – типичный для белков (2S, 3R) и атипичный (2S, 3S).
Рассмотрим разницу на примере треонинов 5 (нетипичный) и 7 (Рис. 2-5).

sorry sorry
sorry sorry


Как можно видеть из рисунков, температурные факторы атомов OG1 и CG2 Tre5 имеют олее высокое значение, чем те же атомы у нормального Tre7.
В сочетании с тем, что элктронная плотность для углерода и кислорода могут быть очень похожи, возможно, что стоит просто заменить их местами.
Важным дополнением можно извлечь и из отчета PDBREPORT, где показали,
что треонин 5 содержит и атипчную длину связи. То есть, ошибки тут дополняют одна другую.


Модель 1DLP

Структура 1DLP с разрешением 3.30 А была расшифрована в 2000 году. Это гексамер белка LECTIN SCAFET PRECURSOR.
В pdb-файле можно обнаружить атомы с нулевым коэффициентом заполнения.
Очень интересно читать отчет PDBREPORT,
где такие атомы перечислены в разделе ZERO OCCUPANCY ATOM. Также в файле беда с картой Рамачандрана и другими параметрами.

Рассмотрим уникальные примеры на рисунках 6 и 7:
sorry sorry


Как мы видим, условия ни на углы, ни на расстояния между атомами не соблюдаются в этих и некоторых других остатках.
Причина, наверняка, именно в нулевом коэффициенте заполнения, иными словами, модель вписала атомы сюда потому что ей
надо было их вписать хоть куда-нибудь. Вероятно, авторы не хотели оставлять боковые цепи свободными.
Кроме того, вспомним, что разрешение структуры откровенно низкое, а например температурный фактор известных атомов аргинина оставляет желать лучшего (38.08 для СА атома, Рис. 7).

Ниже преведено подтверждение слов про нулевой коэффициент заполнения*.
                        
                                                        * 
ATOM   1004  CG  ASN A 136      58.627  90.110  34.403  0.00 20.00           C  
ATOM   1005  OD1 ASN A 136      58.461  89.077  33.787  0.00 20.00           O  
ATOM   1006  ND2 ASN A 136      58.300  90.272  35.704  0.00 20.00           N 
...
ATOM   4716  CB  ARG C 167      80.188  77.637  46.951  0.00 20.00           C  
ATOM   4717  CG  ARG C 167      81.160  77.095  45.943  0.00 20.00           C  
ATOM   4718  CD  ARG C 167      80.497  76.065  45.054  0.00 20.00           C  
ATOM   4719  NE  ARG C 167      80.793  74.648  44.964  0.00 20.00           N  
ATOM   4720  CZ  ARG C 167      81.179  73.412  44.666  0.00 20.00           C  
ATOM   4721  NH1 ARG C 167      81.808  73.151  43.492  0.00 20.00           N  
ATOM   4722  NH2 ARG C 167      80.921  72.404  45.532  0.00 20.00           N  
...
ATOM   4729  OD1 ASP C 168      73.065  77.542  45.924  0.00 20.00           O  
ATOM   4730  OD2 ASP C 168      73.949  75.666  45.211  0.00 20.00           O 



2. Коэффициент заполнения и температурный фактор при разном разрешении.

С помощью поиска "Advanced search" на сайте PDB был произведен поиск структур, полученных с помошью РСА, разрешением до 1 Ангстрема и от 2.0 до 2.5 Ангстрем.
Для каждой из двух групп была выбрана модель: 1US0 (самый большой из белков такого хорошего разрешения - 0.66 Ангстрем) и 4TY7 (белок сопоставимого размера, разрешением 2.09 Ангстрем).
Длина белковых цепей 316 и 244 остатков соответственно, белки являются мономерами.

Извлечь коэффициент заполнения и B-фактор для каждого атома можно по-разному, напримем разбив текст в Excel и проведя сортировку.
Ненужные столбцы и строки можно частично отбросить сразу, что-то отбросим после сортировки.
Для двух белков быстрее такой полуавтоматический способ, для 20 файлов уже имеет смыл писать скрипт.

Нетрудно получить (см. файл с расчетами выше), что в структуре 1US0 из 3679 атомов 1248 имеет коэффициент заполнения менее единицы (это 33.92%),
в то время как в структуре среднего разрешения 4TY7 лишь 10 гетероатомов сульфата имели коэффициент заполнения 0.5. То есть из 2147 атомов 0.47% имели occupancy менее 1.
Данные анализа температурых факторов атомов занесем в таблицу 1.


Таблица 1. Параметры температурных факторов структур 1US0 и 4TY7.
Структура разрешение, А Среднее Ст. откл. max min
1US0 0.66 8.58 7.35 56.89 2.40
4TY7 2.09 26.50 13.50 96.32 11

Из таблицы 1 очевидно, что для структуры высокого разрешения температурный фактор ниже (а occupancy выше).
Визуализируем это заключение в виде "box-plot" ("ящика с усами") (Рис. 8,9).

sorry sorry
Наглядно видно, что различия очень существенны и достоверны.





На страницу 7 семестра


© Aleshin Vasily