Учебный сайт Николаевой Дарьи

Главная Ссылки Обо мне Заметки

Сравнение разметок вторичных структур из PDB-файла и полученных с помощью сервисов DSSP и Stride


Этот практикум посвящен проблеме разметки вторичной структуры белков. У нас имеются данные о разметке из самого PDB-файла, а также можно воспользоваться сервисами, определяющими вторичную структуру белков. Идея этого практикума как раз и заключается в том, чтобы сравнить эти разметки.

В качестве объекта я взяла уже полюбившийся мне белок - вирусную флавин-зависимую тимидилатсинтазу ThyX из вируса Paramecium bursaria Chlorella virus 1 (PDB ID: 2CFA). В шапке его PDB-файла в полях "HELIX" и "SHEET" содержится информация о вторичной структуре белка. Далее я воспользовалась веб-сервисами, использующими программы DSSP и Stride, и с их помощью получила разметку вторичной структуры: DSSP-result, Stride-result.

Сразу хочу отметить, что та вторичная структура, которую мы видим, когда пишем

show cartoon, selection

не соответствует таковой из PDB-файла (Рис. 1 (слева)). Более близкую к PDB-файлу раскраску можно получить так (Рис. 1 (справа)):

action > assign sec. struc.

Границы элементов вторичной структуры по этой раскраске отличаются от вторичной структуры на ленточной модели часто, но, как правило, незначительно. Исключение - небольшая альфа-спираль, где раскраска сильно отличается от ленточных границ (выделена черным овалом). Важно, что данная структура представляет собо димер, и во второй цепи несовпадение сохраняется (правый верхний угол Рис. 1 справа).

Изображение не загрузилось Изображение не загрузилось
Рис. 1. Раскраски структуры белка тимидилатсинтазы ThyX (PDB ID: 2CFA) по вторичной структуре, соответствующей ленточной модели (слева), и вторичной структуре (assign sec. struc.) (справа). Альфа-спирали показаны красным цветом, бета-тяжи - желтым, свободные петли - зеленым. Черным овалом на рисунке справа выделена спираль, где раскраски различаются особенно сильно.


Для подробного сравнения разметок я выбрала четыре элемента вторичной структуры: короткую и длинную альфа-спирали и два бета-тяжа, тоже короткий и длинный. В Таблице 1 представлена информация о границах этих элементов, определенных в PDB-файле и сервисами DSSP и Stride. Также в структуре этого белка есть довольно много (3 штуки в цепи А и 4 штуки в цепи В) коротких спиралей 3/10, и мне стало интересно, насколько хорошо сервисы их определяют. И дополнительно я проверила, одинаково ли размечает один и тот же способ один и тот же элемент вторичной структуры в двух разных цепях А и В (+ в колонках A vs. B (способ), если разметка совпала). Выбранные для рассмотрения структуры показаны на Рис. 2.

Изображение не загрузилось
Рис. 2. Структура белка тимидилатсинтазы ThyX (PDB ID: 2CFA) (показана темно-синим цветом) с выделенными элементами вторичной структуры (рассматриваемыми в Таблице 1): альфа-спирали показаны красным цветом, бета-тяжи - желтым, 3/10-спирали - бирюзовым. Границы раскраски элементов определялись по PDB-файлу (или по разметке Stride, если элемента вторичной структуры не было в PDB).


Таблица 1. Сравнение границ некоторых элементов вторичных структур, определенных с помощью сервисов DSSP и Stride, и взятых из PDB-файла

Тип структуры

Границы (PDB)

Границы (DSSP)

Границы (Stride)

A vs. B (PDB)

A vs. B (DSSP)

A vs. B (Stride)

1

бета-тяж

A/Ser2 - A/Pro11

A/Ser2 - A/Pro11

A/Ser2 - A/Pro11

B/Ala3 - B/Pro11

B/Ala3 - B/Pro11

+

2

бета-тяж

B/His83 - B/Glu86

B/His83 - B/Glu86

B/His83 - B/Glu86

+

+

+

3

альфа-спираль

B/Thr40 - B/Tyr47

B/Ala41 - B/Arg50

B/Ala41 - B/Lys46

+

+

+

4

альфа-спираль

A/Trp125 - A/Lys147

A/Trp126 - A/Lys146

A/Trp125 - A/Lys147

+

+

+

5

3/10-спираль

-

-

A/Tyr47 - A/His51

+

+

+

6

3/10-спираль

A/His53 - A/Thr59

A/Trp54 - A/Glu58

A/Ser55 - A/Phe57

+

+

B/Ser55 - B/Glu58

7

3/10-спираль

A/Phe156 - A/Leu158

A/Arg155 - A/Ile157

A/Arg155 - A/Ile157

B/Cys153 - B/Leu158

B/Ala154 - B/Ile157

B/Lys151 - B/Ile157

8

3/10-спираль

В/Asn34 - В/Lys39

В/Gln35 - В/Asn38

В/Gln35 - В/Asn38

-

-

-



Видим, что бета-тяжи (1 и 2) определяются всеми способами одинаково, а в разметке альфа-спиралей (3 и 4) наблюдаются разночтения, причем ближе к разметке из PDB-файла оказывается разметка Stride. Чтобы проанализировать этот результат, хорошо бы знать, как размечается вторичная структура в PDB. Однако она обычно определяется авторами, а в их статье я не нашла информации об этом. Поэтому можно только предположить, что Stride более близок к разметке PDB благодаря использованию большего количества информации (статистики экспертных аннотаций), чем DSSP.
В двух цепях разметки для каждого способа часто совпадают, поэтому если они отличаются, то причина, скорее всего, в дефектах расшифровки структуры.

Что касается 3/10-спиралей (5-8), то здесь много различий и между способами и между цепями, причем даже трудно сказать, кто к кому ближе. Кажется, как будто бы разметки DSSP и Stride больше похожи друг с другом, чем любая из них с разметкой из PDB-файла. Думаю, что такие разночтения связаны с тем, что эти спирали более редкие, чем альфа-спирали, поэтому нет четкого рецепта по их выделению. Усугубляет ситуацию близость к этим спиралям областей поворотов. Также рядом с этими спиралями часто находятся плохо расшифрованные области (пунктирные петли на Рис. 1 и 2), что тоже могло повлиять на разметку (и особенно на различия в разметке между цепями). Особенно интересно, что о спирали 5 совсем нет структурной информации в файле PDB, хотя ленточная модель показывает там спираль (черный овал на Рис. 1).

© 2017 Дарья Николаева