AlphaFold2
Аминокислотная последовательность, для предсказания трёхмерной структуры которой я воспользовалась AlphaFold2, в моём случае на 72% идентична человеческой D-допахромдекарбоксилазе (UniProt, PDB). Этот фермент превращает D-допахром в 5,6-дигидроксииндол (мономер нейромеланина) и участвует в ряде регуляторных процессов, связанных с иммунной системой. Я буду сравнивать предсказания AlphaFold2 с РСА-моделью 1DPT данного белка.
Полная последовательность
Видно, что предсказанные AF2 модели практически идентичны друг другу и 1DPT, даже в неструктурированных областях. Длина β-тяжей у AF2-моделей немного отличается от 1DPT - вероятно, положение атомов всё же несколько различное, и вторичная структура размечается по-разному.
Покрытие для данного предсказания очень хорошее - даже у С-конца набирается около 400 последовательностей, хотя Identity у большинства в районе 30%. Среднее plDDT примерно равно 98 для всех моделей, что говорит о высокой вероятности соответствия модели реальной структуре. РАЕ-графики (не представлены) все синие - AF2 также уверен в расположении отдельных остатков относительно друг друга в созданных моделях.
Последовательность с N-концевой делецией
5 моделей с делецией также отлично сходятся друг с другом. Поскольку N-конец белка участвует в формировании β-листа и находится внутри него, а не с краю, я ожидала, что его делеция приведет к существенным изменениям в структуре - например, смещению цианового фрагмента (Рис.3, справа, крайний β-тяж у полноразмерной модели). Но AF2 смоделировал местонахождение этого фрагмента так же, как и для полной последовательности. Тогда я решила присмотреться к остаткам, формирующим циановый фрагмент и находящуюся рядом с ним α-спираль, и обнаружила протяженную зону гидрофобных контактов, наверняка вносящую вклад в стабилизацию положения цианового фрагмента. Однако подозрительно то, что конформация остова фрагмента всё ещё соответствует таковой для β-тяжа.
Метрики качества предсказания AF2 для последовательности с делецией хороши, как и в случае полной последовательности. Снижается покрытие N-конца в случае с делецией (но остается более чем приемлемым), что, вероятно, связано с особенностями алгоритмов выравнивания, используемых AF2. Картинки не привожу, архивы с результатами предсказаний можно скачать здесь: full, del.
Судя по проделанной работе, AlphaFold2 очень хорошо справляется с предсказанием трёхмерной структуры для относительно коротких последовательностей однодоменных белков с хорошим покрытием. В рассмотренном случае структура белка с делецией N-концевого участка цепи предсказывается AF2 ошибочно из-за сдвига предсказаний в сторону уже известных пространственных структур. Чтобы исследовать правильность моделирования AF2 различного рода делеций, можно подобрать несколько белков, для которых известны полноразмерные структуры и структуры с делециями, и посмотреть на результаты предсказаний AF2.