Прежде всего
1T35.pdb — файл модели белка в формате PDB
script.spt — скрипт в формате spt
Для начала
Мой белок в базе PDB имеет идентификатор 1T35
. (Шариковую модель, предусмотренную первым заданием, см. ниже.)
Заголовок структуры: LYASE
. Название структуры: CRYSTAL STRUCTURE OF A HYPOTHETICAL PROTEIN YVDD—A PUTATIVE LYSINE DECARBOXYLASE
.
Название молекулы: HYPOTHETICAL PROTEIN YVDD, PUTATIVE LYSINE DECARBOXYLASE
. Белок состоит из восьми одинаковых по исходному аминокислотному составу цепей (то есть является октомером), названных буквами от A до H. Каждая цепь, если следовать информации из генома, должна содержать по 191 остатку (подробнее об этом ниже).
Каждая из цепей включает по 12 остатков селенометионина (MSE/SELENOMETHIONINE
; формула C5 H11 N O2 SE
), которые, хотя и не включены в состав структуры белка (множество protein
в RasMol) в разметке PDB-файла, на деле представляют собой просто модифицированные метионины, где атом серы заменен на атом селена. В каждой цепи они размещаются на позициях 1, 29, 46, 54, 64, 87, 94, 104, 142, 143, 145, 176. Интересно, что обычных метионинов в белке нет. Также макромолекула белка содержит 14 сульфат-ионов (SO4/SULFATE ION
; формула O4 S 2-
). Еще есть 45 молекул воды (HOH
; формула H2 O
). Они распределены по цепям неравномерно.
Скрипт
Вся макромолекула в шариковой модели:
Только белок в остовной модели:
Только белок в ленточной модели:
Белок в остовной модели (цепи раскрашены в разные цвета), многоатомные лиганды в шарнирной и одноатомные — в шариковой:
Здесь можно видеть многочисленные селенометионины, немного сульфат-ионов, а также загадочные плавающие отдельно от всего красные шарики. Это, конечно, вода с невидимыми по понятным причинам атомами водорода.
А вот на пятом шаге нас поджидает сюрприз. Здесь нужно выбрать любую цепь по вкусу и в ней показать N- и C-концевые аминокислотные остатки. Что может быть проще? Первый остаток с аминогруппой находится легко, это тот самый селенометионин; при попытке же выбрать 191-й остаток любой цепи мы столкнемся с сообщением No atoms selected
. Хммм. Заглянем в файл PDB: описания атомов в цепях действительно обрываются на 179-м остатке, кроме почему-то цепи E, которая обрывается на 184-м. Тем не менее, секция SEQRES
везде рапортует о 191 остатке. И только потом в секции REMARK 465
находится объяснение в виде блока MISSING RESIDUES
c пояснением: THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE EXPERIMENT
. Далее следует список не обнаруженных при рентгеноструктурном анализе аминокислотных остатков, который для всех цепей, кроме Е, состоит из остатков 180-191, а для цепи E — 185-191. Вероятно, эти «потерянные» остатки объясняются тем, что либо мРНК подвергается сплайсингу, либо белок проходит какую-то посттрансляционную обработку.
Но радоваться еще рано. Хотя концевая аминогруппа N-концевого остатка, как уже было упомянуто, легко находится, найти нормальную карбоксильную группу C-концевого остатка так и не удалось. К последнему карбоксильному атому углерода крепится только один-единственный атом кислорода. Другого нет. Это было бы нормально, если бы это был просто очередной остаток цепи, но здесь цепь вообще-то заканчивается. Почему так происходит, я не знаю, возможно, это какой-то артефакт кристаллизации.
Вычисления
Что касается структуры, то мой белок по общей форме своей несомненно напоминает толстый бублик. Лучше всего эту структуру можно аппроксимировать цилиндром с радиусом 5 нанометров и высотой опять-таки 5 нанометров.
Клетку кишечной палочки мы представляем как цилиндр с радиусом 500 нанометров и высотой 2 000 нанометров. Чтобы подсчитать, сколько маленьких цилиндриков поместится в большом, надо, во-первых, вычислить, сколько оснований одного поместится на основании другого, а потом — сколько маленьких уместится один за другим по длине большого. Потом эти два числа умножить. По длине помещается 2 000 ÷ 5 = 400 молекул; чтобы подсчитать, сколько же окружностей радиусом 5 нм уместится в окружности радиусом 500 нм, вспомним (или вычислим заново), что коэффициент оптимальной упаковки окружностей по площади практически точно равен 0,9; принимая это значение, получим (500 ÷ 5)² × 0,9 = 9 000 молекул. Умножаем два числа: 400 × 9 000 = 3 600 000 молекул белка в клетке кишечной палочки. Это значит, что белок не очень большой. Если же все 4 400 белков синтезировать одновременно и все они будут примерно такого же размера, как мой, то каждый белок будет представлен в клетке 3 600 000 ÷ 4 400 = 820 молекулами. Не так уж и много.
Будем размещать наши молекулы-цилиндрики в одной плоскости, плашмя — так для набора критической площади их потребуется меньше. Если мы будем светить на белок фиолетовым светом (~400 нм), предел разрешения микроскопа будет 200 нм. В принципе, если разместить белки в ряд один за одним (тогда потребуется 20 их молекул), они создадут объект, который будет виден под микроскопом как с трудом различимая черточка. Если стремиться создать некое пятнышко круглой формы, то, пользуясь тем же коэффициентом упаковки, получим (100 ÷ 5)² × 0,9 = 360 молекул.
Найди десять отличий
В прошлый раз мы получили с помощью программы ChemSketch модель 15-й аминокислоты этого же самого белка — L-аспарагина. Построим теперь изображение этой же структуры из модели белка, используя цепочку команд
restrict Asn15:A centre selected spacefill 130 wireframe 50
И получим такой результат:
(слева — модель в ChemSketch, справа — в RasMol)
Основных различия два: во-первых, на рентгеноструктурной модели нет атомов водорода, потому что поймать их не позволяет разрешение; во-вторых, там нет OH-группы у гидроксильного атома углерода, так как слева изображена аминокислота, а справа — остаток аминокислоты. Пространственная структура и расположение атомов в рентгеноструктурной и теоретической модели, конечно, тоже должны несколько отличаться, но в данном случае это влияет на внешний вид меньше, чем искажения, вносимые слегка различными точками зрения.