Occupancy - доля элементарных ячеек, в которых присутствует данный атом в данной позиции, может быть меньше единицы из-за альтернативных конформаций.
Поиск белковых структур с расширенными параметрами производится с помощью Advanced search PDB. Я выбрал параметры поиска Experimental methods->X-Ray и Resolution->0..1
Всего было выведено 851 структур. из которых я выбрал 5OTN - выделенный из Danio rerio 2-гидрокси-dATP-дифосфатаза, катализирующий следующую реакцию:
В его PDB-файле присутствуют следующие строчки
A - название полипептидной цепи, число за ним - номер аминокислотного остатка (66 в моем случае), далее - координаты атома (x,y,z), за ним коэффициент Occupancy (в моем случае 0.5, то есть атом в даном положении находится в половине случаев), B-фактор и название атома.
Missing residues - остатки, которые не получилось расшифровать в РСА-эксперименте.
Параметры поиска Experimental methods->X-Ray и Resolution->3..5
Найдено 10006 структур, я выбрал 6BPY - тиоредоксинредуктазу из Aspergillus fumigatus с разрешением 3.201 Å.
Данный PDB-файл содержит довольно много Missing Residues (аж 105 штук), я приведу пример самых первых.
С PDB-структурой связаны 3 последовательности:
Рассмотрим примр, при котором 1 и 2 последовательность не совпадают. Параметры поиска - Experimental methods->X-Ray и Sequence features->wild-type protein
Всего найдено 143861 структур, я выбрал 6N9G - кристаллическую структуру сигнального димера RGS7-Gbeta5, выделенного из Bos taurus.
Поле DBREF - соответствие между текущей последовательностью и последовательностями других баз данных (в моем случае это UniProt)
Поле SEQADV - отличия последовательности, описанной в поле SEQRES PDB-файла, от последовательности, описанной в DBREF.
К моему удивлению таких отличий набралось порядочно (здесь представлена только часть). Все они заключаются в разной последовательности аминокислот некоторого участка (а у нескольких там вообще 1-2 аминокислоты). Скрее всего это сигнальный пептид или экспрессионный тэг.
В-фактор (или температурный коэффициент) задает поправку на неидеальность кристалла, характеризует статистическую и динамичкскую неупрядоченность. Имеет размерность Å в квадрате. Хорошими значениями считаются В < 10, а плохими > 50 (а если В = 100, то это значит, что атом вообще потеряли).
Для демонстрации я использовал 1f8r, то есть тот самый LAAO из гладкого щитомордника. Мне не удалось найти хорошие В-факторы.
© Борисов Евгений 2018