1. Поиск странностей в PDB-файлах

7GPB

Структура 7GPB была расшифрована в 1991 году в ходе исследования: Structural mechanism for glycogen phosphorylase control by phosphorylation and AMP. Разрешение структуры - 2,9 Å. Это структура гомотетрамерного фермента гликогенфосфорилазы b, в комплексе с АМФ.


Рис.1 Структура 7PGB

В этой структуре визуально обнаруживается нарушение планарности боковых цепей: кольца некоторых триптофанов лежат не в одной плоскости, чего на самом деле быть не может. Ниже изображены триптофаны-67 цепей A и D, наиболее выраженно отклоняющиеся от нормального вида.
Рис.2 Нарушение планарности Trp-67 из цепи A (слева) и из цепи D (справа).

В PDB-файле можно найти информацию о температурных факторах (B-факторах), которые могли бы немного объяснить происходящее:

Рис.3 Данные в PDB-файле по необычному триптофану-67 и обычному триптофану-174 цепи D.

Действительно, для 67-го триптофана B-факторы (последняя колонка) для C-атомов боковой цепи значительно больше соответствующих B-факторов триптофана-174, хоть и B-факторы атомов главной цепи меньше для Trp-67. Для Trp-67 цепи А ситуация с B-факторами аналогичная, они немного выше обычного:


Рис.4 Данные в PDB-файле по необычному триптофану-67 цепи A.

В базе данных PDBREPORT нашла информацию по данной структуре и поискала обнаруженные для триптофанов ошибки. Между атомами NE1 и CE2 триптофана-67 цепи А детектирована необычная длина связи, а в графе "Side chain planarity problems" первые три наиболее отклоняющиеся остатка - как раз наши триптофаны (число в поледней колонке характеризует отклонение (в сигмах) подсчитанного RMS от нормального):

2527 TRP   (  67-)  D   36.29
  58 TRP   (  67-)  A   12.99
1170 TRP   ( 361-)  B   10.86

5RXN

Структура расшифрована в 1984 году, с разрешением 1,2 Å. Это мономерный рубредоксин, связанный с ионом Fe.


Рис.5 Структура рубредоксина в комплексе с атомом Fe, 5RXN.

В этой структуре обнаруживаются проблемы с треонином. Для белков характерен только один стереоизомер, L-треонин, хотя теоретически существует 4 формы, т.к. у треонина 2 хиральных атома. Здесь же, кроме L-треонина, можно найти также L-аллотреонин:

Рис.6 L-аллотреонин 5 и "нормальные" L-треонины 7 и 28.

В PDBREPORT отмечена нетипичная длина связи между атомами CB и OG1 пятого треонина, а также его нетипичные углы (число в последне колонке означает количество сигм, на которые отклоняется значение угла от нормального):

5 THR   (   5-)  A      CA   CB   OG1 117.16    5.0
5 THR   (   5-)  A      CG2  CB   OG1 118.47    4.6

В записи PDB информация о структурных факторах соответствует происходящему:

Рис.7 Данные в PDB-записи по нетипичному Thr-5 и обычному Thr-7.

B-факторы для углеродов боковой цепи пятого треонина заметно больше, чем у седьмого.

Xиральностью обладают также боковые цепи изолейцина и гидроксипролина (из тех аминокислот, что встречаются в белках).

1DLP

Структура 1DLP была расшифрована в 2000 году , разрешение - 3,3 Å. Белок относится к лектинам и представляет собой гексамер.


Рис.8 Структура 1DLP.

Если посмотреть на pdb-файл, сразу можно заметить значительного размера списки пропущенных остатков и атомов, а также атомов с коэффициентом заполнения 0; там же есть и предупреждение о том, что данным по этим атомам доверять нельзя:


Рис.8 Данные в pdb-файле об атомах с нулевым коэффициентом заполнения.

Возьмем первый же остаток из списка - девятый гистидин цепи А.


Рис.9 Структура His9A.

Видим, что строение остатка противоречит природным законам. То же самое касается остатков Asn136A и Arg167C:

Рис.10 Структура Asn136A (слева) и Arg167C (справа).

В PDBREPORT тоже есть информация об этих особенностях, а так же о многочисленных нетипичных длинах связей, углах, конформациях остова, нарушениях хиральности и т.д. Там также говорят, что нулевой коэффициент заполнения присваивается иногда в тех случаях, когда атома на самом деле не видно.

2. Сравнение коэффициентов заполнения и B-факторов в структурах атомного и среднего разрешения.

Воспользовавшись Advanced Search в PDB, выбрала две структуры: 4K8M с разрешением 0.87 Å и 4NKR с разрешением 2,41 Å.

В pdb-файле нашла данные по B-факторам и коэффициентам заполнения. Ниже представлены результаты в виде гистограмм распределения.

Рис.11 Гистограммы распределения B-факторов.

Видно, что диапазон значений фактора шире, а среднее значение значительно выше - у структуры с более низким разрешением, 4NKR.

Для 4NKR все коэффициенты заполнения равны 1, а для более точной структуры 4K8M распределение следующее:


Рис.12 Гистограмма распределения факторов заполнения для 4K8M.