Рентгеноструктурный анализ

❧❧❧❧❧❧

Построение и визализация электронной плотности

Использовалась структура белка RadA (вовлечён в репарацию, архейный гомолог RecA), PDB id 4b3b, разрешение структуры 1.19 Å.
Электронная плотность была загружена с сайта EDS (файл) и загружена в Pymol вместе со структурой. Ниже приведены изображения (рис.1, рис.2) электронной плотности белка с разным уровнем подрезки ЭП. Видно, что координаты атомов в целом хорошо вписаны в электронную плотность, для одной из петель средняя ЭП ниже, чем в среднем по белку.
При визуализации используются статистические единицы измерения — превышение сигнала над шумом Z = (R – M)/S, где R - начение ЭП в данной точке пространства (x,y,z) в физических единицах, M - среднее значение ЭП по ячейке кристалла, S-среднее квадратичное отклонение.

Рис. 1 Структура 4b3b - остов - при разных уровнях подрезки ЭП.
Видно, что остов хорошо вписывается в карту ЭП.
При уровнях подрезки 1 и 2.7 визуализируется ЭП всей молекулы, т.е. атомов и обобществлённая ЭП химических связей. При уровне 2.7 ЭП начинает фрагментироваться на сопряжённые системы.
При уровне подрезки 3 сигма визуализируется ЭП отдельных атомов, можно видеть, что в одной из петель этого не происходит - вероятно, в этой области есть подвижность и ЭП размазана.

Рис. 2 Три аминокислотных остатка разных типов из 4b3b при разных уровнях подрезки ЭП.
Видно, что атомы хорошо вписаны в ЭП.
При уровне подрезки 1.0 визуализируется в т.ч. ЭП, соответствующая атомам водорода (расшифрованы в структуре, на рисунке показаны оранжевым).
При уровне подрезки 2.0 визуализируется ЭП атомов и химических связей, при 2.7 она начинает дробиться на отдельные группы. Координаты всех атомов, за исключением водородов, по прежнему хорошо соответствуют карте ЭП и определяются на ней.
При уровне 3.5 ЭП полностью дробится на атомы и сопряжённые системы - кольцо гистидина, пептидные связи, COOH-группа аспартата.

❧❧❧❧❧❧

Восстановление ЭП

Использовалась модель из двух гипотетических молекул, она была была создана с помощью скрипта compile-func.py, который моделирует функцию электронную плотность в зависимости от заданных параметров. В данном случае модель описывалась следующими параметрами:
Электронная плотность для каждого атома задается Гауссовой функцией с параметрами высоты (число электронов), ширины (радиус атома) и точки максимума (координата атома). Общая шкала 30.
Расстояние между молекулами примерно соотвествует длине водородной связи, Одна молекула трехатомная, вторая - двухатомная.
Модель была создана следующей командой:

-g 2,3,5+32,3,6.3+2,3,7.6+16,3,11.1+2,3,12.3

Был получен файл со значениями (func.txt) и графическое изображение ЭП модели (рис.3)

Рис. 3 Рассматриваемая модель электронной плотности

Затем с помощью скрипта func2fourier функция была разложена в ряд Фурье. Команда:

func2fourier.py -i func.txt -o fourier.txt

Было получено 500 гармоник (0-499), их коэффициенты (фазы и амплитуды) записаны в файл fourier.txt
.

Восстановление функции электронной плотности по набору гармоник

По частичным суммам ряда с помощью скрипта fourier2func восстанавливалась исходная функция распределения ЭП. Были взяты разные частичные суммы (разное число гармоник). Восстановленная по 499 гармоникам функция неотличима от исходной. Минимальный порог числа гармоник, при котором функция хорошо восстанавливается - 25, для его определения было проведено восстановление функции ЭП по 9, 12, 20, 25 и 30 гармоникам (рис.4, рис. 5). Исходная функция ЭП показана сплошной линией, результат восстановления показан пунктиром на всех рисунках с результатами восстановления.

Рис. 4 Наложения восстановленных функций (пунктир) на исходную (сплошная линия), полученные скриптом fourier2func.
Верхний ряд: 9 гармоник от начала разложения, 12 гармоник.
Нижний ряд: 20 гармоник, 25 гармоник

Рис. 5 Наложение восстановленной функций (пунктир) на исходную (сплошная линия), полученные скриптом fourier2func. 30 гармоник.

Восстановление с добавлением шума

В реальном эксперименте измерения всегда сопровождаются некоторым шумом, смоделируем эту ситуацию с помощью скрипта func2fourier.py, где зададим параметры -F и -P, шум в определении структурных факторов и фаз, соответственно. Далее отберём 25 гармоник из получившегося разложения и восстановим функцию ЭП по ним. Результаты восстановления функции ЭП по гармоникам с включением шума приведены на рисунке 6. Видно, что при 20%-ном фазовом шуме функция восстанавливается гораздо хуже, чем при 20%-ном шуме в значениях структурных факторах. Таким образом, фазовый шум больше влияет на реконструкцию ЭП, чем шум в определении структурных факторов, что особенно драматично, учитываю фазовую проблему.

Рис. 6 Восстановление с добавлением шума. Слева направо: F=20, P=20, P=10.

Неполный набор гармоник

В реальных условия удаётся определить коэффициенты разложения не для всех гармоник, смоделируем эту ситуацию, удаляя часть гармоник из набора. Попробуем удалить первую гармонику, 1-3 из середины и добавить одну с номером 35 (25+10).

Удаление начальных гармоник сдвигает базовую линию, пики различимы даже лучше, чем в исходной рекострукции по 25 гармоникам (рис. 7).
Удаление гармоник из середины приводит к результатам, схожим с добавлением шума, пропорционально числу удалённых гармоник (рис. 7)
Добавление гармоники с высоким номером не влияет на качество реконструкции (рис. 8)

Рис. 7 Восстановление по неполному набору гармоник.
Верхний ряд: Восстановление по гармоникам 2-25; восстановление по гармоникам 0-25 с исключением гармоники 15.
Нижний ряд: восстановление по гармоникам 0-25 с исключением гармоник 9, 15; восстановление по гармоникам 0-25 с исключением гармоник 9,12,15.

Рис. 8 Восстановление по неполному набору гармоник: гармоники 0-25+35

Определение разрешения неполного набора гармоник

По определению, разрешение полного набора гармоник - длина волны гармоники с наибольшим номером. Для неполного набора гармоник определения разрешения не существует, но явно нужно каким-то образом учесть ухудшение разрешения при неполноте набора. Попробуем учесть также и то, что гармоники с разными номерами вносят разный вклад, например, так:

d для неполного набора данных: d=d0*(1 + 1/n), где n - номер гармоники, n>1, d0=разрешение полного набора гармоник.

Если не хватает нескольких гармоник, добавляем 1/n для каждой, так, если нет двух:

d=d0*(1 + 1/n + 1/m), n,m - номера гармоник.

Понятно, что такое определение будет хорошо работать в случае отсутствия гармоник из середины или конца. В случае же, когда не хватает преимущественно гармоник из начала, будем использовать такое определение:

d=d0*(N-k)/N, где N - номер последней гармоники, k - число отсутствующих.

Итоги

В таблице 1 приведена информация о восстановлении функции ЭП при разных условиях. Стоит отметить, что наибольшее влияние имеют шум, особенно в фазах гармоник и неполнота набора в случае, если не хватает гармоник из "середины" списка.

Таблица 1. Восстановление ЭП по коэффициентам ряда Фурье

Набор гармоник	Разрешение (Å)	Полнота данных (%)	Шум амплитуды (% от величины F)	Шум фазы (% от величины phi)	Качество восстановления
Полные наборы гармоник
0-498	0,06	100	0	0	идентично оригинальной функции
0-9	3,33	100	0	0	Плохое
0-12	2,5	100	0	0	Среднее
0-20	1,5	100	0	0	Среднее (максимумы значительно сдвинуты относительно реального положения)
0-25	1,2	100	0	0	Отличное
0-30	1	100	0	0	Отличное
0-25	1,2	100	20	0	Хорошее
0-25	1,2	100	0	10	Хорошее
0-25	1,2	100	0	20	Среднее
Неполные наборы гармоник
2-25	1,2	92	0	0	Отличное
0-25, 35	1,17	74	0	0	Отличное
0-25, без 15	1,28	96	0	0	Хорошее
0-25, без 9,15	1,41	92	0	0	Хорошее
0-25, без 9,12,15	1,51	88	0	0	Отличное

❧❧❧❧❧❧

Восстановление кристалла из PDB файла

В поле CRYST1 pdb-фала указана следующая информация:

CRYST1   40.227   60.589   87.524  90.00  90.00  90.00 P 21 21 21    4

Кристаллографические характеристики:

Длины направляющих векторов кристалла:

a = 40.227 Å
b = 60.589 Å
c = 87.524 Å

Углы между направляющими векторами кристалла:

α = 90.00°
β = 90.00°
γ = 90.00°

Кристаллографическая группа: P 2₁2₁2₁

P - примитивная пространственная группа, винтовые оси 2₁ по осям X, Y и Z

Число молекул в ячейке: 4

При помощи команды symexp sym, 4b3b, all, 3 было получено изображение расположения соседних с данной молекул в структуре кристалла. На рис. 9 приведена кристаллографическая ячейка структуры, а на рис. 10 - общий вид участка кристалла RadA.

Рис. 9 Кристаллографическая ячейка структуры 4b3b

Рис. 10 Участок кристалла RadA

Белок имеет 12 соседей в кристалле, а, следовательно, 12 зон контактов. Рассмотрим полярные контакты, для этого найдём водородные связ между оригинальной структурой и соседями. Обнаружено 2 обширных зоны контакта (рис 11, слева) - с помощью них белки слипаются в полосу, в этом участвуют остатки длинной альфа-спирали с одной стороны и малоструктурированные участки с другой.
Наблюдаются также две другие зоны контакта (рис 12, справа), здесь всего одна водородная связь, это взаимодействие, скорее всего, поддерживает геометрию кристалла, но не является достаточным для его образования.
Все эти взаимодействия, скорее всего, не участвуют в олигомеризации белка в растворе, т.к. расположение молекул в кристалле совсем не напоминает олигомерное кольцо, которое RadA образует в естественных условиях.

Рис. 11 Контакты между соседними белками в кристалле RadA

Объяснение странностей расположения белковых цепей в структуре ДНК-белкового комплекса

В 3D-структуре гомеодомена engrailed из Drosophila melanogaster в комплексе с молекулой ДНК (3hdd) одна из белковых цепей расположена на краю молекулы ДНК (рис. 12, слева и сверху), что довольно странно. Тот же белок, связанный с ДНК в другом месте образует явно больше связей. Для того, чтобы разобраться в происходящем, восстановим соседние ячейки (рис. 12, слева и снизу). Можно заметить, что на самом деле молекула ДНК имеет липкие концы (рис 12, справа, красный и фиолетовый остатки контактируют, два других конца показаны розовым, красный и фиолетовый остатки также участвуют в стекинг-взаимодействии - каждый с одним из розовых), которыми контактирует с другой такой же, таким образом, белок не висит на краю, а связан с двухцепочечной ДНК. Такая ДНК с липкими концами, скорее всего - специальное ухищрение для кристаллизации комплекса (образуется "бесконечный" комплекс ДНК-ДНК).

Рис. 12 Структура 3hdd и её особенности (см. пояснения в тексте)

❧❧❧❧❧❧

Изучение файла структурных факторов

С сервера RCSB был скачан файл структурных факторов и преобразован в Excel-таблицу.

Параметры, указываемые в таблице:

id кристалла (всегда 1 для ипользуемого метода - в эксперименте использовался только 1 кристалл)
id длины волны (всегда 1 для ипользуемого метода - измерения велись при постоянной длине волны)
scale group code
Статус структурного фактора
Индекс рефлекса h
Индекс рефлекса k
Индекс рефлекса l
Статус структурного фактора
F_meas_au - cреднее значение измерений структурного фактора
F_meas_sigma_au - cреднее квадратичное отклонение от среднего

Всего было измерено 64404 значения структурных факторов, для оптимизации были использованы 61153 (95%) из них, оставшиеся 3251 - "свободные" - использовались для измерения Rfree.
Данные не являются идеально полными, в таблице ниже представлены некоторые примеры h,k,l, для которых структурные факторы не измерены.

Таблица 2. Некоторые индексы h,k,l, для которых структурные факторы не измерены

	h	k	l
1	0	0	все нечётные l<72
2	h<6	k<44	l<4
3	6	21	8
4	34	13	5
5	15	6	65
6	11	33	0
7	5	35	7
8	9	3	0
9	14	4	0
10	32	10	3
11	32	10	10

В целом, неизмеренные рефлексы в основном имеют маленькие h,k,l (видимо, эта информация теряется, т.к. эти рефлексы приходятся на заглушку) или находятся в конце диапазона по одному из индексов.
Данные из середины интервала по всем индексам достаточно полные (не обнаружено таких пропусков).

❧❧❧❧❧❧

Оформление отчёта

отчёт

❧❧❧❧❧❧

Сравнение структур, полученных методами ЯМР и РСА

Был выбран цитохром c-553 из Bacillus pasteurii. Структура, полученная РСА - 1C75 с разрешением 0.97 Å, а с помощью ЯМР - 1K3G (30 моделей). Как видно из рис. Х1, они схожи, и отличаются скорее тем, как определена вторичная структура, чем укладкой. Два участка белка распознаны как часть альфа-спирали в одной структуре и как петли в другой, это места "сгибов" спиралей. Начало "красной" спирали также отличается.

Рис. Х1 Сравнение структур цитохрома с-553, полученных с помощью РСА (сверху) и ЯМР (снизу), первая модель.
Показана только одна модель ЯМР, так как большое количество моделей не рендерится программой pymol

Для анализа были выбраны 3 водородные связи (рис Х2):

Остовная в альфа-спирали ASP62-ASN66. Расстояние 2.9 Å

Связь между боковыми радикалами, входящими в альфа-спираль, и экспонированными к поверхности глобулы
ASP62-ASN66. Расстояние 2.8 Å. Интересно, что образуется именно между теми остатками, которые образуют ещё и водородную связь остовами.

Водородная связь в петле, выходящей на поверхность глобулы
ASP39-THR41. Расстояние 2.7 Å. Связь имеет сомнительную геометрию, но расстояние между атомами очень маленькое, других связей в петлях не нашлось, поэтому выбрана эта.

Все приведённые расстояния - между донором протона и акцептором. Атомы водорода определены в структуре, поэтому они показаны на рисунке. В белке, в целом, мало водородных связей вне остова альфа-спиралей.

Рис. Х2 Выбранные водородные связи и их положение в белке.
СЛЕВА: Водородные связи между двумя остатками в альфа-спирали (Asp62 и Asn66) - остовная связь и связь между радикалами. СПРАВА: Водородная связь между двумя остатками (Asp39 и Thr41) в петле, обращённой в растворитель.

Были рассмотрены расстояния между атомами, образующими вышеназванные водородные связи в структуре, полученной методом ЯМР (рис. Х3). Оказалось, что первые две связи присутствуют во всех моделях, в большинстве из них расстояния для каждой связи 2.7 Å, редко 2.8 Å. Сохранение осевой водородной связи не удивительно, т.к. альфа-спираль - достаточно жёсткая структура. Эта связь ограничивает подвижность остатков в целом, а кроме того, сближает радикалы нужным образом, видимо, поэтому они образуют связь во всех моделях.
Водородная связь в петле, напротив, не присутствует ни в одной модели (все расстояния больше 4.0 Å, все,кроме одного, больше 4.4 Å) и является, по-видимому, артефактом кристаллизации. Радикал аспартата 39 является высокоподвижным (рис. Х3, это видно и на рис. Х2, он определён неоднозначно), и, вероятно, не образует водородных связей с белком, образуя их с растворителем.

Рис. Х3 Расположение рассматриваемых остатков в структуре, полученной методом ЯМР.
СЛЕВА: Во всех моделях сохраняются водородные связи между аспартатом и аспарагином. Область образования остовной водородной связи показана оранжевым, а связи между радикалами - голубым. Любопытно, что связь имеется во всех структурах, несмотря на подвижность образующих её групп.
СПРАВА: Водородная связь между остатками, расположенными в петле, не образуется в растворе: группы, которые могли бы её образовать (показаны розовым и фиолетовым) достаточно удалены друг от друга.

Какие участки белка подвижны в растворе? Чтобы ответить на этот вопрос, совместим структуры (см. рис. Х4). Видно, что подвижными являются петли, а альфа-спирали в кристалле несколько более скручены, чем в растворе.

Рис. Х4 Наложения структур цитохрома с-553, полученных с помощью РСА (1C75) и ЯМР (1K3G, первая модель)