Оцена качества 3D структур
1. Поиск несоответствий в PDB файлах.
Модель 7GPB
Представленная в файле 7GPB модель изображает структуру гомотетрамера гликогенфосфорилазы
и имеет разрешение 2.90 А.
Статья относится еще к 1991 году, а последние изменения датируются 2011 годом (поле REVDAT в файле .pdb),
однако, судя по записям на сайте PDB (поле Revision History), они не относились к изменению модели.
В модели 7GPB встречаются грувые с биологической точки зрения, ошибки, например Trp67 цепи D.
На Рис. 1 видно, насколько несвойственное положени занимают углероды в боковой цепи триптофана:
Рис. 1. Цепь D модели 7GPB с выделенными триптофанами. У триптофанов 67, 189 и 825 приведены
данные для атомов СА и СН2 в формате (остаток, номер, "температурный фатор"
или "atomic displacement parameter").
Как видно из рисунка 1, температурный фактор цикле боковой цепи триптофана 67
цепи D значительно выше.
То есть, в данной области электронная плотность
не имела острого пика, а была размыта. Тем не менее,
по-видимому, модель, которую использовали авторы в 1991 году,
не учитывала необходимости планарности ароматических циклов,
поэтому предпочла расположить атомы
в тех местах, где соответствие данным было бы наилучшим.
Выходит,
химические законы пали жертвой недоработанной модели.
Хочется отметить, что по данным сайта
PDBREPORT указано еще много проблемных моментов в структуре
7GPB,
но в поле Side chain planarity problems на первом месте стоит как неправильный именно триптофан 67
цепи D (среди других остатков немало триптофанов,
плюс аргинины, аспарагины и глутаматы, см ситуацию со
структурой 1DLP ниже).
Модель 5RXN
Это модель структуры рубредоксина Clostridium pasteurianum, разрешение 1.20 А.
Структура была расшифрована в 1984-1985 годах, последние изменения в 2009 году (REVDAT).
В модели можно найти два диастереомера треонина – типичный для белков (2S, 3R)
и атипичный (2S, 3S).
Рассмотрим разницу на примере треонинов 5 (нетипичный) и 7 (Рис. 2-5).
- Рис. 2 и 3. Стереоизомерия Thr5 (атипичного) файла 5RXN.
- Рис. 4 и 5. Стереоизомерия Thr7 (нормального для белков) файла 5RXN.
Как можно видеть из рисунков, температурные факторы атомов OG1 и CG2 Tre5 имеют олее высокое значение, чем те же атомы у
нормального Tre7.
В сочетании с тем, что элктронная плотность для углерода и кислорода могут быть очень похожи,
возможно, что стоит просто заменить их местами.
Важным дополнением можно извлечь и из отчета
PDBREPORT, где показали,
что треонин 5 содержит и атипчную
длину связи. То есть, ошибки тут дополняют одна другую.
Модель 1DLP
Структура 1DLP с разрешением 3.30 А была расшифрована в 2000 году. Это гексамер белка LECTIN SCAFET PRECURSOR.
В pdb-файле можно обнаружить атомы с нулевым коэффициентом заполнения.
Очень интересно читать отчет PDBREPORT,
где такие атомы перечислены в разделе ZERO OCCUPANCY ATOM. Также в файле беда с картой Рамачандрана и
другими параметрами.
Рассмотрим уникальные примеры на рисунках 6 и 7:
- Рис. 6. Asn 136 цепи А.
- Рис. 7. Остатки Arg 167 и Asp 168 цепи С.
Как мы видим, условия ни на углы, ни на расстояния между атомами не соблюдаются в этих и некоторых других остатках.
Причина, наверняка, именно в нулевом коэффициенте заполнения, иными словами, модель вписала атомы сюда потому что ей
надо было их вписать хоть куда-нибудь. Вероятно, авторы не хотели оставлять боковые цепи свободными.
Кроме того, вспомним, что разрешение структуры откровенно низкое, а например температурный фактор известных
атомов аргинина оставляет желать лучшего (38.08 для СА атома, Рис. 7).
Ниже преведено подтверждение слов про нулевой коэффициент заполнения*.
*
ATOM 1004 CG ASN A 136 58.627 90.110 34.403 0.00 20.00 C
ATOM 1005 OD1 ASN A 136 58.461 89.077 33.787 0.00 20.00 O
ATOM 1006 ND2 ASN A 136 58.300 90.272 35.704 0.00 20.00 N
...
ATOM 4716 CB ARG C 167 80.188 77.637 46.951 0.00 20.00 C
ATOM 4717 CG ARG C 167 81.160 77.095 45.943 0.00 20.00 C
ATOM 4718 CD ARG C 167 80.497 76.065 45.054 0.00 20.00 C
ATOM 4719 NE ARG C 167 80.793 74.648 44.964 0.00 20.00 N
ATOM 4720 CZ ARG C 167 81.179 73.412 44.666 0.00 20.00 C
ATOM 4721 NH1 ARG C 167 81.808 73.151 43.492 0.00 20.00 N
ATOM 4722 NH2 ARG C 167 80.921 72.404 45.532 0.00 20.00 N
...
ATOM 4729 OD1 ASP C 168 73.065 77.542 45.924 0.00 20.00 O
ATOM 4730 OD2 ASP C 168 73.949 75.666 45.211 0.00 20.00 O
2. Коэффициент заполнения и температурный фактор при разном разрешении.
С помощью поиска "Advanced search"
на сайте PDB был произведен поиск структур, полученных с помошью РСА, разрешением до 1 Ангстрема
и от 2.0 до 2.5 Ангстрем.
Для каждой из двух групп была выбрана модель: 1US0
(самый большой из белков такого хорошего
разрешения - 0.66 Ангстрем) и 4TY7
(белок сопоставимого размера, разрешением 2.09 Ангстрем).
Длина белковых цепей 316 и 244 остатков соответственно, белки являются мономерами.
Извлечь коэффициент заполнения и B-фактор для каждого атома можно по-разному, напримем разбив
текст в Excel и проведя сортировку.
Ненужные столбцы и строки можно частично отбросить сразу, что-то отбросим после сортировки.
Для двух белков быстрее такой полуавтоматический способ, для 20 файлов уже имеет смыл писать скрипт.
Нетрудно получить (см. файл с расчетами выше), что в структуре 1US0 из 3679 атомов 1248 имеет коэффициент заполнения
менее единицы (это 33.92%),
в то время как в структуре среднего разрешения 4TY7 лишь 10 гетероатомов сульфата имели
коэффициент заполнения 0.5. То есть из 2147 атомов 0.47% имели occupancy менее 1.
Данные анализа температурых факторов атомов занесем в таблицу 1.
Таблица 1. Параметры температурных факторов структур 1US0 и 4TY7.
Структура |
разрешение, А |
Среднее |
Ст. откл. |
max |
min |
1US0 |
0.66 |
8.58 |
7.35 |
56.89 |
2.40 |
4TY7 |
2.09 |
26.50 |
13.50 |
96.32 |
11 |
Из таблицы 1 очевидно, что для структуры высокого разрешения температурный фактор ниже (а occupancy выше).
Визуализируем это заключение в виде "box-plot" ("ящика с усами") (Рис. 8,9).
- Рис. 8. "Температурный фактор" атомов в выбранных структурах высокого и среднего разрешения.
- Рис. 9. "Occupancy" атомов в выбранных структурах высокого и среднего разрешения.
Наглядно видно, что различия очень существенны и достоверны.
На страницу 7 семестра
© Aleshin Vasily