Таблица аминокислот

[2]
Название C-атомов по греческому алфавиту: \alpha,\beta,\gamma,\delta,\epsilon,\zeta,\eta - A, B, G, D, E, Z, H.
Важно помнить и знать, как называются все атомы всех аминокислот.
Интересно, что некоторые атомы могут быть названы двояко.
Фенилаланин - нет однозначного определения CD1 и CD2, детали в PDB решаются авторами. Его атомы имеют sp2 гибридизацию.
У валина CB-атом имеет валентности по вершинам тетраэдра, т.е. sp3 гибридизацию, но CG1 отличается от CG2. Нельзя развернуть валин так, чтобы один атом наложился на другой, т.к. важен угол. ! Не является свойством хиральности, так проявляются статистические свойства одного положения.
NH1 и NH2 аргинина - тоже отличаются статистически.
А вот треонин - хирален. Есть даже PDB, в котором “неправильный” треонин, ошибочный, из-за софта.
Аспартат и глутамат имеют заряд, размазанный между кислородами. OD1 и OD2 не различаются. Название - произвольное. Нет никакой статистической или биологической разницы.

Задача студента - знать все названия и атомное содержание.

Водородная связь

[3]
Водородная связь - очень особенная, её энергия большая по сравнению с другими типами взаимодействия атомов молекул. Природа: кислород сильнее притягивает электроны, чем водород \rightarrow происходит образование частичного заряда. То же самое - с молекулой аммиака и водой. Если расположить молекулы правильно, то все начинает немного взаимно притягиваться.
Но если заменить водород дейтерием, сила взаимодействия уменьшится. Таким образом, электростатическое притяжение - не единственное явление, вносящее вклад в водородную связь.
Пробуем разобраться, что еще влияет. В химии описано следующее явление. Если у электрона есть большая вероятность перескочить на соседний атом, образуется состояние “отсутствия определенной энергии”, состояние равной вероятности найти электрон возле одного и другого атома. Причем эта энергия падает с ростом расстояния. Поэтому H_{2}^{+} - устойчивое состояние. Эта энергия не приводит к бесконечному сближению атомов, так как находится в балансе с отталкиванием атомов. (см. последние два тома Фейнмана в последнем издании, написано доступно и популярно)
В случае водородной связи протон - очень похож на электрон, но много тяжелее. По сути, для него тоже все может выполняться, хотя и на меньших уровнях энергии.
H_{2}O + NH_{3} \longleftrightarrow OH^{-} + NH_{4}^{+}
Если заменить водород на дейтерий, который более тяжелый, то вероятность перескока уменьшится. Из-за всех этих явлений положение и энергию водородной связи очень трудно вывести и обсчитать теоретически. Может быть, можно порешать уравнение Шредингера, но пока таких работ не было.

[4]
В структуре белка есть много составляющих, способных образовывать водородные связи. Возможно взаимодействие одного лизина сразу с тремя соседними атомами, например.

[5-6]
Доказательство того, что у водородной связи есть оптимальная длина. Когда начинается перекрывание границ атомов - Ван-дер-Ваальсово отталкивание. Углы водородных связей расположены самым удобным образом, так, чтобы могло осуществляться максимальное их число, с водяным окружением тоже. Т.о. есть предпочтительные углы, приведены примеры для азота, кислорода серина.

[7]
Интересно, что связанная вода тяготеет к плоскости. Кислород воды чувствует ароматическое кольцо и располагается ближе, например, к пи-системе тирозина.

[8]
Из распределения расстояния между атомами белка и кислородом воды видно, что 2.8 A - идеальная длина водородной связи, хотя наблюдается вплоть до 3 A.

[9]
Программа HBPlus позволяет увидеть список всех водородных связей в структуре. Вообще, таких программ много, а функции, позволяющие найти связи, включены в PyMol и RasMol. Но выдача одной программы может сильно отличаться от выдачи другой программы.

Ван-дер-Ваальсово взаимодействие.

[10]
Ван-дер-Ваальсов радиус - расстояние между центрами атомов, ближе которого начинается их отталкивание. Отталкивание в белках очень сильное, а вот притяжение - очень слабое, в 10 раз слабее водородных связей, поэтому роли почти не играет. Им можно пренебрегать.

Силы, удерживающие форму молекулы белка

[11]
Ван-дер-ваальсово отталкивание - стоит лишь заменить в белке валин на лейцин, чтобы заметить разницу.
Водородные связи.
Гидрофобное взаимодействие.
Водяные мостики, слабее водородных связей. Часто играют большую роль, если мутировать важный участвующий остаток - связь заметно ослабнет.
Электростатические силы - играют большую роль не столько в поддержании структуры, сколько в сворачивании. Видимо, играют роль в динамике.
Связи через ионы - например, через Mg или Na. Трудно изучать, т.к. ионы очень плохо видны в .pbd, программы, возможно, распознают их как воду.
Ван-дер-Ваальсово притяжение - очень слабо, поэтому вряд ли играет роль.

Торсионные углы

[12]
Торсионный угол принимает значение от -180 до 180. Нужно взять четыре атома, спроецировать одну связь на плоскость, и подсчитать угол между крайними связями. Важно, что это не угол между плоскостями.

Карта Рамачандрана

[13]
Если менять углы \phi и \psi, то они далеко не все возможны. Есть запрещенные положения, когда атомы наползают друг на друга.
Разрешенная область - близка к параметрам плоскости (левый верхний угол). С небольшими потерями энергии можно попасть и в другие области.
Исходно карта Рамачандрана построена теоретически для модели жестких шариков, т.е. приведенная здесь карта может отличаться от реальной картины.

[14]
Карта Рамачандрана для определенной, реальной структуры: похожа на теорию, но немного отличается, т.к. реальные атомы - не жесткие шарики.

[15-16]
Карты Рамачандрана для отдельных остатков.
Глицин - редко бывает в альфа-спирали (?), т.к. он ее дестабилизирует, одинаково хорошо формирует право- и левозакрученные спирали.
У нормальных остатков пептидная связь крутится хорошо, а у пролина - плохо. Редко находится в альфа спирали, хотя её стабилизирует, просто он плохо формирует водородные связи.

[17]
Угол \Omega определяет цис- и транс-конформации остатков. В пептидной связи O-C-N не вертится, т.к. находится в транс-конформации. Цис-трансформации встречаются редко, чаще в .pdb с низким разрешением (т.е. видимо, являются ошибками).

[18]
В целом альфа-спираль фиксируется тем, что все остатки не могут сразу выходить из разрешенных областей. Помимо этого, еще больший эффект - у водородных связей.

[19-20]
Бета-тяж - чуть спиралевидный, по сути медленная спираль. Водородные связи расположены между соседними тяжами. Листы бывают параллельные и антипараллельные. Параллельные тяжи связаны хуже, чем параллельные. Хорошо видны при рассмотрении в пространстве.


Алгоритм DSSP - Definition of the Secondary Structure of Proteins

[26]
Существует фиксированная разметка структуры после разрешения - удобно хранить и знать классификацию структур. Один из алгоритмов разметки вторичной структуры - DSSP.
Вход: файл в формате PDB.
Выход: текстовый файл с информацией о каждом остатке.
Основан на поиске водородных связей, которые имеются в каждой структуре. Внутрь вшита программа нахождения водородных связей. После того, как все водородные связи нарисованы - ищем паттерны водородных связей, регулярные структуры. Далее паттерны объединяются в элементы вторичной структуры.

Шаг 1

[27-28]
Нахождение водородных связей между остовными N и O. Измерение всех попарных расстояний, получение суммы. Потенциал E обратно пропорционален расстояниям.
Формула: E = f_{q_{1},q_{2}}(\frac{1}{r_{NO}} + \frac{1}{r_{HC'}} - \frac{1}{r_{HO}} - \frac{1}{r_{NC'}},
где:
q_{1,2} - заряды в единицах заряда электрона, считается, что атомы имеют парциальные заряды.
r_{NO} и др. - межатомные расстояния в ангстремах.
Критерий водородной связи E < -0,5 ккал/моль. У этого порога - оптимальная чувствительность и специфичность.

[29]
Если нарисовать все водородные связи, видно, что есть лишние (например, внутри бета-тяжа, её de facto быть не должно).

[30]

Шаг 3


Поиск элементарных паттернов: n-поворот, детекция также отрицательных (n=-5,... ).

[31]
Мостики (bridges) - параллельные или антипараллельные. Параллельные - либо (i-1)O  - - (j)N, либо (j)O - -(i+1)N. Антипараллельные - либо (i)O  - - (j)N, (j)O - -(i)N, либо то же, но через 1 индекс. Последнее - очень удобная конформация для антипараллельного бета-тяжа.

[32]
Существуют еще паттерны, не связанные с водородными связями.
Излом (bend) - изменение направления более, чем на 70 градусов.
Хиральность - знак (+ или -) торсионного угла CA-атомов i-1, i, i+1, i+2, приписанный остатку i. Торсионный угол положителен в альфа-спирали. В бета-листах обычно отрицательная хиральность.

Шаг 3

[33]
Выделение элементов вторичной структуры.
Спирали. Минимальная спираль может быть составлена из 4 остатков (т.е. 2 последовательных 4-поворотов). Если можем продолжить - продолжаем, объединяем идущие подряд минимальные спирали. Вопрос, допускаются ли в спирали пропуски альфа-спиралей? Да.
Отдельно - недокрученные или перекрученные спирали - 3- (3_{10}) и 5- (\pi).

[34]
Лестница - один или более мостиков одного типа, идущих подряд.
Если у лестниц есть хотя бы один общий остаток - они связаны.
Бета-лист - максимально связный набор лестниц.
Допускаются выпячивания, с некоторым ограничением. Не обязательно строго подряд.

[35]
Выдача алгоритма.
Обозначения:
H - \alpha спираль,
B - \beta тяж,
E - extended strand,
G - несколько остатков, связанных водородными связями, но не имеющие определенной структуры,
I - 5- или \pi-спираль, перекрученная,
T - поворот,
S - изгиб более, чем на 70 градусов.

Алгоритм устроен так, то в одном месте можно детектировать и лестницу, и поворот, например. Но есть приоритет структур (выше типы отсортированы по приоритету).

Этот алгоритм - до сих пор наиболее употребляемый.

Алгоритм Stride.

[36]
В 95 году был сделан более правильный алгоритм. В нем другой расчет энергии водородной связи. Идея: смотреть на углы \phi, \psi в определенных экспертами альфа-спиралях.
В алгоритме используются чуть более хитрые значения энергии, статистики углов \phi, \psi (взяты из аннотаций PDB).

[37-41]
Строим статистику для спиралей и тяжей. Для каждого атома ищем вероятность того, что он принадлежит водородной связи.
Критерий пары, чтобы считаться зародышем альфа-спирали.
Имеем две константы и три порога. Берем PDB и меняем параметры до тех пор, пока не будет лучшего совпадения с ним.

Другие алгоритмы

[42]
Вообще, существует множество других алгоритмов. И видимо, появилось еще больше за последнее время. Кроме уже описанных, есть методы рассмотрения только C\alpha-атомов.
Идея. Взять несколько PDB, взять экспертов, велеть им определять границы элементов. Проводился такой эксперимент, лучшее совпадение с экспертами дал алгоритм Stride.