Colabfold

Предсказание влияния делеции на структуру

На анализ было представлено 2 последовательности фермента D-dopachrome decarboxylase (организм не удалось установить), согласно данным BLAST. Одна из этих последовательностей полная и имеет длину 118 аминокислот, вторая – имеет делецию 9 а.о. N-концевого фрагмента. При помощи сервиса Colabfold были предсказаны третичные структуры этих белков (см. рис. 1). Настройки были выставлены по умолчанию, кроме требования искать шаблоны среди других известных последовательностей.

Исходя из рисунка, делеция изменила вторичную структуру в N-концевой части белка, так пропали короткая альфа-спираль и 2 антипараллельных листа, и на месте одного из них возникла неупорядоченная структура. Однако боковые радикалы а.о. никаки не изменили своего положения при делеции участка (данные не показаны). Возможно, на результат повлияла настройка с поиском шаблонов.

session1
Рис. 1. Сравнение структур без делеции и с ней. Красным цветом показана нативная структура, синим – с делеции

На рис. 2 представлено сравнение моделей структур с делецией, в одном случае настройка с поиском шаблонов была включена, в другом нет. Как видно, модели идентичны. Боковые радикалы также не имеют отклонений при выравнивании. Отсюда может следовать, что либо шаблонов нет, либо независимо от существующих структур гомологичных белков Colabfold не различает белок с делеции от нативного.

session1
Рис. 2. Сравнение структур,имеющих делецию, c поиском шаблонов (синий цвет) и без него (фиолетовый)

Для проверки неспособности сгенерировать структуры, учитывающих влияние делеции, можно провести генерацию структур с делецией такой же длины, но в других местах. Затем выровнять эти модели, чтобы выяснить степень наложения боковых радикалов. Также стоит обращать внимание при анализе итоговых моделей на относительное положение элементов вторичной структуры. Одно из объяснений неудачного результата в том, что в базе, на которой обучался AlphaFold, недостаточно представлены структуры одних и тех же белков с различиными заменами, делециями и вставками в силу сложности получения такого количества данных экспериментальными методами.