Учебный сайт Кирилла Цуканова → Первый семестр

Работа в программе RasMol

Прежде всего

1T35.pdb — файл модели белка в формате PDB
script.spt — скрипт в формате spt

Для начала

Мой белок в базе PDB имеет идентификатор 1T35. (Шариковую модель, предусмотренную первым заданием, см. ниже.)

Заголовок структуры: LYASE. Название структуры: CRYSTAL STRUCTURE OF A HYPOTHETICAL PROTEIN YVDD—A PUTATIVE LYSINE DECARBOXYLASE.

Название молекулы: HYPOTHETICAL PROTEIN YVDD, PUTATIVE LYSINE DECARBOXYLASE. Белок состоит из восьми одинаковых по исходному аминокислотному составу цепей (то есть является октомером), названных буквами от A до H. Каждая цепь, если следовать информации из генома, должна содержать по 191 остатку (подробнее об этом ниже).

Каждая из цепей включает по 12 остатков селенометионина (MSE/SELENOMETHIONINE; формула C5 H11 N O2 SE), которые, хотя и не включены в состав структуры белка (множество protein в RasMol) в разметке PDB-файла, на деле представляют собой просто модифицированные метионины, где атом серы заменен на атом селена. В каждой цепи они размещаются на позициях 1, 29, 46, 54, 64, 87, 94, 104, 142, 143, 145, 176. Интересно, что обычных метионинов в белке нет. Также макромолекула белка содержит 14 сульфат-ионов (SO4/SULFATE ION; формула O4 S 2-). Еще есть 45 молекул воды (HOH; формула H2 O). Они распределены по цепям неравномерно.

Скрипт

Вся макромолекула в шариковой модели:

Только белок в остовной модели:

Только белок в ленточной модели:

Белок в остовной модели (цепи раскрашены в разные цвета), многоатомные лиганды в шарнирной и одноатомные — в шариковой:

Здесь можно видеть многочисленные селенометионины, немного сульфат-ионов, а также загадочные плавающие отдельно от всего красные шарики. Это, конечно, вода с невидимыми по понятным причинам атомами водорода.

А вот на пятом шаге нас поджидает сюрприз. Здесь нужно выбрать любую цепь по вкусу и в ней показать N- и C-концевые аминокислотные остатки. Что может быть проще? Первый остаток с аминогруппой находится легко, это тот самый селенометионин; при попытке же выбрать 191-й остаток любой цепи мы столкнемся с сообщением No atoms selected. Хммм. Заглянем в файл PDB: описания атомов в цепях действительно обрываются на 179-м остатке, кроме почему-то цепи E, которая обрывается на 184-м. Тем не менее, секция SEQRES везде рапортует о 191 остатке. И только потом в секции REMARK 465 находится объяснение в виде блока MISSING RESIDUES c пояснением: THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE EXPERIMENT. Далее следует список не обнаруженных при рентгеноструктурном анализе аминокислотных остатков, который для всех цепей, кроме Е, состоит из остатков 180-191, а для цепи E — 185-191. Вероятно, эти «потерянные» остатки объясняются тем, что либо мРНК подвергается сплайсингу, либо белок проходит какую-то посттрансляционную обработку.

Но радоваться еще рано. Хотя концевая аминогруппа N-концевого остатка, как уже было упомянуто, легко находится, найти нормальную карбоксильную группу C-концевого остатка так и не удалось. К последнему карбоксильному атому углерода крепится только один-единственный атом кислорода. Другого нет. Это было бы нормально, если бы это был просто очередной остаток цепи, но здесь цепь вообще-то заканчивается. Почему так происходит, я не знаю, возможно, это какой-то артефакт кристаллизации.

Вычисления

Что касается структуры, то мой белок по общей форме своей несомненно напоминает толстый бублик. Лучше всего эту структуру можно аппроксимировать цилиндром с радиусом 5 нанометров и высотой опять-таки 5 нанометров.

Клетку кишечной палочки мы представляем как цилиндр с радиусом 500 нанометров и высотой 2 000 нанометров. Чтобы подсчитать, сколько маленьких цилиндриков поместится в большом, надо, во-первых, вычислить, сколько оснований одного поместится на основании другого, а потом — сколько маленьких уместится один за другим по длине большого. Потом эти два числа умножить. По длине помещается 2 000 ÷ 5 = 400 молекул; чтобы подсчитать, сколько же окружностей радиусом 5 нм уместится в окружности радиусом 500 нм, вспомним (или вычислим заново), что коэффициент оптимальной упаковки окружностей по площади практически точно равен 0,9; принимая это значение, получим (500 ÷ 5)² × 0,9 = 9 000 молекул. Умножаем два числа: 400 × 9 000 = 3 600 000 молекул белка в клетке кишечной палочки. Это значит, что белок не очень большой. Если же все 4 400 белков синтезировать одновременно и все они будут примерно такого же размера, как мой, то каждый белок будет представлен в клетке 3 600 000 ÷ 4 400 = 820 молекулами. Не так уж и много.

Будем размещать наши молекулы-цилиндрики в одной плоскости, плашмя — так для набора критической площади их потребуется меньше. Если мы будем светить на белок фиолетовым светом (~400 нм), предел разрешения микроскопа будет 200 нм. В принципе, если разместить белки в ряд один за одним (тогда потребуется 20 их молекул), они создадут объект, который будет виден под микроскопом как с трудом различимая черточка. Если стремиться создать некое пятнышко круглой формы, то, пользуясь тем же коэффициентом упаковки, получим (100 ÷ 5)² × 0,9 = 360 молекул.

Найди десять отличий

В прошлый раз мы получили с помощью программы ChemSketch модель 15-й аминокислоты этого же самого белка — L-аспарагина. Построим теперь изображение этой же структуры из модели белка, используя цепочку команд

restrict Asn15:A
centre selected
spacefill 130
wireframe 50

И получим такой результат:


(слева — модель в ChemSketch, справа — в RasMol)

Основных различия два: во-первых, на рентгеноструктурной модели нет атомов водорода, потому что поймать их не позволяет разрешение; во-вторых, там нет OH-группы у гидроксильного атома углерода, так как слева изображена аминокислота, а справа — остаток аминокислоты. Пространственная структура и расположение атомов в рентгеноструктурной и теоретической модели, конечно, тоже должны несколько отличаться, но в данном случае это влияет на внешний вид меньше, чем искажения, вносимые слегка различными точками зрения.