AlphaFold2

 Аминокислотная последовательность, для предсказания трёхмерной структуры которой я воспользовалась AlphaFold2, в моём случае на 72% идентична человеческой D-допахромдекарбоксилазе (UniProt, PDB). Этот фермент превращает D-допахром в 5,6-дигидроксииндол (мономер нейромеланина) и участвует в ряде регуляторных процессов, связанных с иммунной системой.
 Я буду сравнивать предсказания AlphaFold2 с РСА-моделью 1DPT данного белка.

Полная последовательность

Картиночка из паймола
Рис. 1. 5 моделей, сгенерированных AF2 (цветные), сопоставленные с 1DPT (серая).

 Видно, что предсказанные AF2 модели практически идентичны друг другу и 1DPT, даже в неструктурированных областях. Длина β-тяжей у AF2-моделей немного отличается от 1DPT - вероятно, положение атомов всё же несколько различное, и вторичная структура размечается по-разному.

ГрафикГрафик

Рис. 2. Оценка предсказания AF2. Слева: покрытие последовательности. Справа: plDDT-plot.

 Покрытие для данного предсказания очень хорошее - даже у С-конца набирается около 400 последовательностей, хотя Identity у большинства в районе 30%. Среднее plDDT примерно равно 98 для всех моделей, что говорит о высокой вероятности соответствия модели реальной структуре. РАЕ-графики (не представлены) все синие - AF2 также уверен в расположении отдельных остатков относительно друг друга в созданных моделях.

Последовательность с N-концевой делецией

Картиночка из паймолаКартиночка из паймола

Рис. 3. Слева: 5 моделей, сгенерированных AF2 (цветные), сопоставленные с 1DPT (серая). N-конец, делетированный в предсказанных моделях, обозначен как "Del". Справа: демонстрация сохранения топологии белка при делеции. Сопоставление лучших моделей из выдачи AF2 для последовательности без и с делецией. Радужная покраска от N-конца к С-концу.

 5 моделей с делецией также отлично сходятся друг с другом. Поскольку N-конец белка участвует в формировании β-листа и находится внутри него, а не с краю, я ожидала, что его делеция приведет к существенным изменениям в структуре - например, смещению цианового фрагмента (Рис.3, справа, крайний β-тяж у полноразмерной модели). Но AF2 смоделировал местонахождение этого фрагмента так же, как и для полной последовательности. Тогда я решила присмотреться к остаткам, формирующим циановый фрагмент и находящуюся рядом с ним α-спираль, и обнаружила протяженную зону гидрофобных контактов, наверняка вносящую вклад в стабилизацию положения цианового фрагмента. Однако подозрительно то, что конформация остова фрагмента всё ещё соответствует таковой для β-тяжа.

Картиночка из паймола
Рис. 4. Лучшая модель белка с делецией. Гидрофобные взаимодействия цианового фрагмента с синей α-спиралью.

 Метрики качества предсказания AF2 для последовательности с делецией хороши, как и в случае полной последовательности. Снижается покрытие N-конца в случае с делецией (но остается более чем приемлемым), что, вероятно, связано с особенностями алгоритмов выравнивания, используемых AF2. Картинки не привожу, архивы с результатами предсказаний можно скачать здесь: full, del.

 Судя по проделанной работе, AlphaFold2 очень хорошо справляется с предсказанием трёхмерной структуры для относительно коротких последовательностей однодоменных белков с хорошим покрытием. В рассмотренном случае структура белка с делецией N-концевого участка цепи предсказывается AF2 ошибочно из-за сдвига предсказаний в сторону уже известных пространственных структур. Чтобы исследовать правильность моделирования AF2 различного рода делеций, можно подобрать несколько белков, для которых известны полноразмерные структуры и структуры с делециями, и посмотреть на результаты предсказаний AF2.