Поиск по PDB и содержание PDB файлов

Атомы с коэффициентами Occupancy, не равными 1

Occupancy - доля элементарных ячеек, в которых присутствует данный атом в данной позиции, может быть меньше единицы из-за альтернативных конформаций.

Поиск белковых структур с расширенными параметрами производится с помощью Advanced search PDB. Я выбрал параметры поиска Experimental methods->X-Ray и Resolution->0..1

Всего было выведено 851 структур. из которых я выбрал 5OTN - выделенный из Danio rerio 2-гидрокси-dATP-дифосфатаза, катализирующий следующую реакцию:

В его PDB-файле присутствуют следующие строчки

Для наглядности я подчеркнул красным искомые коэффициенты Occupancy у некоторых атомов

A - название полипептидной цепи, число за ним - номер аминокислотного остатка (66 в моем случае), далее - координаты атома (x,y,z), за ним коэффициент Occupancy (в моем случае 0.5, то есть атом в даном положении находится в половине случаев), B-фактор и название атома.

Примеры Missing Residues - нерасшифрованные аминокислотные остатки

Missing residues - остатки, которые не получилось расшифровать в РСА-эксперименте.

Параметры поиска Experimental methods->X-Ray и Resolution->3..5

Найдено 10006 структур, я выбрал 6BPY - тиоредоксинредуктазу из Aspergillus fumigatus с разрешением 3.201 Å.

Данный PDB-файл содержит довольно много Missing Residues (аж 105 штук), я приведу пример самых первых.

Отличия в последовательностях кристаллизованного белка и белка в UniProt

С PDB-структурой связаны 3 последовательности:

Рассмотрим примр, при котором 1 и 2 последовательность не совпадают. Параметры поиска - Experimental methods->X-Ray и Sequence features->wild-type protein

Всего найдено 143861 структур, я выбрал 6N9G - кристаллическую структуру сигнального димера RGS7-Gbeta5, выделенного из Bos taurus.

Поле DBREF - соответствие между текущей последовательностью и последовательностями других баз данных (в моем случае это UniProt)

Поле SEQADV - отличия последовательности, описанной в поле SEQRES PDB-файла, от последовательности, описанной в DBREF.

К моему удивлению таких отличий набралось порядочно (здесь представлена только часть). Все они заключаются в разной последовательности аминокислот некоторого участка (а у нескольких там вообще 1-2 аминокислоты). Скрее всего это сигнальный пептид или экспрессионный тэг.

Худший и лучший B-фактор в структуре

В-фактор (или температурный коэффициент) задает поправку на неидеальность кристалла, характеризует статистическую и динамичкскую неупрядоченность. Имеет размерность Å в квадрате. Хорошими значениями считаются В < 10, а плохими > 50 (а если В = 100, то это значит, что атом вообще потеряли).

Для демонстрации я использовал 1f8r, то есть тот самый LAAO из гладкого щитомордника. Мне не удалось найти хорошие В-факторы.

Пример плохих B-факторов и относительно хороших.


© Борисов Евгений 2018