Главная | Ссылки | Обо мне | Заметки | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Сравнение разметок вторичных структур из PDB-файла и полученных с помощью сервисов DSSP и StrideЭтот практикум посвящен проблеме разметки вторичной структуры белков. У нас имеются данные о разметке из самого PDB-файла, а также можно воспользоваться сервисами, определяющими вторичную структуру белков. Идея этого практикума как раз и заключается в том, чтобы сравнить эти разметки. В качестве объекта я взяла уже полюбившийся мне белок - вирусную флавин-зависимую тимидилатсинтазу ThyX из вируса Paramecium bursaria Chlorella virus 1 (PDB ID: 2CFA). В шапке его PDB-файла в полях "HELIX" и "SHEET" содержится информация о вторичной структуре белка. Далее я воспользовалась веб-сервисами, использующими программы DSSP и Stride, и с их помощью получила разметку вторичной структуры: DSSP-result, Stride-result. Сразу хочу отметить, что та вторичная структура, которую мы видим, когда пишем show cartoon, selection не соответствует таковой из PDB-файла (Рис. 1 (слева)). Более близкую к PDB-файлу раскраску можно получить так (Рис. 1 (справа)):action > assign sec. struc. Границы элементов вторичной структуры по этой раскраске отличаются от вторичной структуры на ленточной модели часто, но, как правило, незначительно. Исключение - небольшая альфа-спираль, где раскраска сильно отличается от ленточных границ (выделена черным овалом). Важно, что данная структура представляет собо димер, и во второй цепи несовпадение сохраняется (правый верхний угол Рис. 1 справа).Для подробного сравнения разметок я выбрала четыре элемента вторичной структуры: короткую и длинную альфа-спирали и два бета-тяжа, тоже короткий и длинный. В Таблице 1 представлена информация о границах этих элементов, определенных в PDB-файле и сервисами DSSP и Stride. Также в структуре этого белка есть довольно много (3 штуки в цепи А и 4 штуки в цепи В) коротких спиралей 3/10, и мне стало интересно, насколько хорошо сервисы их определяют. И дополнительно я проверила, одинаково ли размечает один и тот же способ один и тот же элемент вторичной структуры в двух разных цепях А и В (+ в колонках A vs. B (способ), если разметка совпала). Выбранные для рассмотрения структуры показаны на Рис. 2.
Видим, что бета-тяжи (1 и 2) определяются всеми способами одинаково, а в разметке альфа-спиралей (3 и 4) наблюдаются разночтения, причем ближе к разметке из PDB-файла оказывается разметка Stride. Чтобы проанализировать этот результат, хорошо бы знать, как размечается вторичная структура в PDB. Однако она обычно определяется авторами, а в их статье я не нашла информации об этом. Поэтому можно только предположить, что Stride более близок к разметке PDB благодаря использованию большего количества информации (статистики экспертных аннотаций), чем DSSP. В двух цепях разметки для каждого способа часто совпадают, поэтому если они отличаются, то причина, скорее всего, в дефектах расшифровки структуры. Что касается 3/10-спиралей (5-8), то здесь много различий и между способами и между цепями, причем даже трудно сказать, кто к кому ближе. Кажется, как будто бы разметки DSSP и Stride больше похожи друг с другом, чем любая из них с разметкой из PDB-файла. Думаю, что такие разночтения связаны с тем, что эти спирали более редкие, чем альфа-спирали, поэтому нет четкого рецепта по их выделению. Усугубляет ситуацию близость к этим спиралям областей поворотов. Также рядом с этими спиралями часто находятся плохо расшифрованные области (пунктирные петли на Рис. 1 и 2), что тоже могло повлиять на разметку (и особенно на различия в разметке между цепями). Особенно интересно, что о спирали 5 совсем нет структурной информации в файле PDB, хотя ленточная модель показывает там спираль (черный овал на Рис. 1). |
© 2017 Дарья Николаева