По результатам структурного поиска в PDBeFold можно смело (100% совпадение последовательности, Z-score находки 19.3) утверждать, что наш белок - липаза А из B. subtilis.
В литературе, оказывается, мучаются тем, что не могут решить, как правильно называть тот или иной белок: липаза или эстераза [ссылка]. Мы на эту тему рассуждать не будем и скажем, что функция липазы А – гидролиз сложных эфиров. Без уточнения каких.
Просмотрев 10 лучших находок PDBeFold, я не нашел ничего, похожего на кофактор. По всей видимости липаза А "самостоятельная" и в них не нуждается.
Что касается активного центра, то в самой похожей структуре по мнению PDBeFold, есть ковалентно связанный ингибитор. Он нам и покажет, где расположен активный центр.
Наша структура неизвестного белка (зеленая) и цепь А из 1r50 (голубая). Вторичная структура для обеих структур предсказана DSSP в Pymol. По всей видимости, как раз цепь А 1r50 и использовалась при составлении нашей неизвестной структуры: их наложение не потребовалось. Они уже были в таких координатах, как изображено.
Дальше будем работать с цепью А из 1r50.
Сайт связывания расположен на поверхности белка. Он сформирован в основном петлями и альфа-спиралями.
Действительно, на поверхности.
Белок представляет из себя один домен, что облегчает выполнение практикума.
Что касается функции, то на лекциях рассказывалось, что липазы похожи на протеазы, потому как химические реакции не сильно отличаются. Попробую поискать каталитическую триаду и оксианионный центр.
Вот они слева направо: Asp133, His156, Ser77 (каталитическая триада), Met78, Ile12 (оксианионный центр).
Ser77 ковалентно связан с ингибитором. Могу предположить, что такой комплекс не вступает в реакцию дальше, потому что с одной стороны он является аналогом ацил-фермента (если сравнивать с природной реакцией), но имеет при этом отрицательный заряд, что затрудняет атаку на него.
Функциональная роль перечисленных выше остатков подтверждена в литературе.
В CATH домен, соответствующий цепи А структуры 1r50 называется 1r50A00.
Классификация CATH приведена ниже.
Во втором задании нужно для нашей липазы найти с помощью PDBeFold два похожих по структуре, но не похожих по последовательности (<35% Identity) и функции белка. Найти отличия, попробовать выделить функциональный мотив.
С рекомендуемыми в практикуме настройками нашлось 2071 хитов. Отсортируем по % Id и перейдем на последнюю страницу.
Я выбрал 6fvj, цепь D (тиоэстераза из Mycobacterium tuberculosis, 9% Id) и 1mvo, цепь А (некий PHOP RECEIVER DOMAIN FROM BACILLUS SUBTILIS, 9% Id).
1r50, зеленая, 6fvj голубая. Выравнено с помощью cealign в pymol.
Как можно видеть, элементы вторичной структуры неплохо сопоставляются. Есть, впрочем, и уникальные для каждого белка.
1r50, зеленая, 1mvo желтая. Выравнено с помощью cealign в pymol.
В отличие от явно работающего фермента тиоэстеразы, PHOP RECEIVER DOMAIN звучит как что-то неферментативное. PhoP – транскрипционный фактор некоторых патогенных бактерий, участвующий вместе с мембранным белком PhoQ в рецепции бактерией концентрации внеклеточного магния. Эта рецепция позволяет патогену "понимать", когда бактерия находится внутри клетки хозяина (низкая концентрация магния) и в внеклеточной среде (высокая концентрация магния).
Видно, что центральный бета-лист в PHOP RECEIVER DOMAIN состоит только из трех тяжей. Каких-то отличающихся от 1r50 альфа-спиралей нет.
Посмотрим подробнее на структуры и CATH наших находок.
Сравнение активных центров тиоэстеразы (голубая) и липазы (белая). Наложено cealign и сдвинуто вручную для лучшего совпадения остатков.
Триада на месте, оксианонный центр на месте, только вместо Ile12 там Ala37, что ничего не меняет, потому что NH смотрит в ту же сторону.
Что касается причины разной субстратной специфичности у двух белков, то можно предположить, что причина в том, что гидролизуемые функциональные группы встречаются не в вакууме, а в контексте остального куска субстрата. Поэтому меняя остальной карман связывания, можно менять и, как следствие, специфичность к той или иной функциональной группе.
В CATH для 6fvj ничего нет, поэтому я нашел (в CATH же, он сам предлагает) наиболее похожую на этот белок по последовательности запись в CATH: 3FLB. E-value около $10^{-26}$. Это тоже тиоэстераза, так что, наверное, все в порядке.
Все совпадает. Логично, учитывая то, что реакция похожая.
Сравнение структуры в районе активного центра липазы А (белая) и участка регуляторного домена PhoP (желтый).
Как можно видеть, похожего тут мало. Если смотреть остатки, то триады нет.
В группе гомологий отличие, PhoP reciever domain относится к регуляторным доменам. Разумно, учитывая его функцию.