Практикум 7

Бессонницына Анастасия Сергеевна
1 курс Факультета биоинженерии и биоинформатики
Московский Государственный Университет имени М.В.Ломоносова

Выбор белка

В своем миниобзоре я рассматривала бактерию Rummeliibacillus stabekisii. Чтобы найти подходящий белок я перешла в Продвинутый поиск. Для этого в строке поиска UniProtKB я ввела название своего организма. Затем с помощью левой панели фильтров я установила уровень аннотированности 4 — это был максимально возможный уровень для моей бактерии. После я перешла в раздел «Advanced» (расширенный поиск), чтобы задать дополнительные критерии. Сначала я попыталась отобрать белки из курируемой (рецензируемой) базы данных, применив фильтр reviewed:true. Однако для моей бактерии такие белки отсутствовали. После применения всех этих настроек я получила список из 14 белков. Дальнейший выбор я сделала исходя из личной заинтересованности. Мне показалось интересным изучить бифункциональный фермент восстановления НАД(Ф)Н-гидрата — прежде всего потому, что его бифункциональность показалась мне особенно привлекательной.

Информация о белке

Для начала я нашла основную информацию о данном белке:

Основная функция и механизм

После того как была найдена вся справочная информация о белке. Было необходимо разобраться какие функции он выполняет, а также в каких реакциях участвует. Так была найдена информация о том, что анализируемый белок представляет собой бифункциональный фермент, который участвует в системе репарации повреждённых форм пиридиннуклеотидов NAD(P)H. Такие молекулы могут подвергаться ферментативной или термоиндуцированной гидратации, в результате чего образуются токсичные производные NAD(P)HX. Эти соединения существуют в двух эпимерных формах — S и R, и их накопление опасно для клетки, поскольку они нарушают нормальный пул функционально активных NAD(P)H. Именно поэтому рассматриваемый фермент играет важную защитную роль: с одной стороны, он катализирует эпимеризацию S- и R-форм NAD(P)HX, переводя их друг в друга, а с другой — обеспечивает дегидратацию S-формы NAD(P)HX. Благодаря такому механизму клетка может эффективно утилизировать оба эпимера повреждённых NAD(P)H и тем самым восстанавливать запас метаболически активных молекул.

Также дополнительно была найдена информация о структуре данного белка и его особенностях.

Структура: в физиологических условиях белок формирует гомотетрамер.

Особенности: белок A0A143HBF8 из Rummeliibacillus stabekisii обладает модульной структурой с двумя доменами YjeF семейства: N-терминальный (9–219 aa) обеспечивает эпимеразную активность, а C-терминальный (230–511 aa) — дегидратазную, что позволяет выполнять две реакции ремонта поврежденных коферментов NAD(P)HX в одной молекуле. Такая архитектура, вероятно, возникла путем дупликации древнего прото-YjeF домена с последующей функциональной дивергенцией.

Также белок довольно необычно осуществляет дегидратазную реакцию а именно использует качестве ADP, который в ходе реакции превращается в AMP.

Поисковые запросы

Далее я решила подробнее изучить многофункциональные белки.

Распространённость многофункциональных белков

Цель запроса: узнать насколько распространены многофункциональные белки в семействе Caryophanaceae?

Параметры поиска: (taxonomy_id:186818) AND (keyword:KW-0511)

Результат: 1962 белка (~0,5% от всех белков)

С помощью боковой панели я посмотрела распределение по классам ферментов (функция Group by Enzyme Class). Распределение по классам ферментов (Caryophanaceae):

EC-класс Количество белков Доля
Гидролазы1 16738%
Трансферазы1 04734%
Оксидоредуктазы29510%
Лиазы2839%
Лигазы1364%
Изомеразы1164%

Можно заметить, что большую часть составляют гидролазы и трансферазы. Но данное распределение не позволяет узнать какие классы ферментов чаще всего встречаются вместе в одном белке. Для того чтобы это узнать были сделаны дополнительные запросы.

Пример для трансфераз и гидролаз: (keyword:KW-0511) AND (taxonomy_id:186818) AND (ec:2.*) AND (ec:3.*)

Были получены следующие результаты:

Комбинация EC-классовКоличество белков
Трансфераза + Гидролаза496
Оксидоредуктаза + Гидролаза218
Лиаза + Гидролаза181
Изомераза + Гидролаза106
Лиаза + Лигаза88
Лиаза + Изомераза9

Остальные пары не были найдены. Таким образом можно сделать вывод, что самым распространенным видом многофункционального белка у данного семейства это белки сочетающие в себе функции гидролазы и трансферазы.

Дополнение: также в процессе я заметила, что довольно часто встречаются белки с двумя номерами EC 2.* я хотела придумать запрос как их тоже посчитать, но пока я не смогла придумать нормальный способ проверки этого. Также есть неточность в том, что некоторым мультифункциональным белкам присваивают только 1 EC номер (например белок Adenylyl-sulfate kinase — A0A0B5AUU1) из-за этого подобные белки оказываются не включенными в анализ.

Локализация многофункциональных белков

Позже мне стало также интересно распределение многофункциональных белков по компартментам клетки.

Цель запроса: узнать насколько часто встречаются многофункциональные белки бактерий из семейства Caryophanaceae в разных компартментах клетки

Параметры поиска (Caryophanaceae): (taxonomy_id:186818) AND (keyword:KW-0511) AND (cc_scl_term:*). Также дополнительно проверено с помощью предыдущих параметров поиска какие комбинации белков встречаются.

Локализация (SL-код) Количество белков Примечание по составу EC-классов
Цитоплазма [SL-0086]425Только чистые гидролазы или только чистые трансферазы (комбинаций нет)
Цитоплазматическая мембрана [SL-0039]143Все — комбинация трансферазы и гидролазы
Cell envelope / Клеточная оболочка [SL-0036]59Все — гидролазы (белки оболочки без чётко установленного компартмента, мембраны исключены)
Мембраны, не относящиеся к цитоплазматической [SL-0162]8Все — комбинация гидролаз и трансфераз

Четвертичная структура многофункциональных белков

Также мне показалось интересным изучить какая наиболее распространённая четвертичная структура у многофункциональных белков данного семейства.

Вопрос исследования: какая четвертичная структура наиболее часто встречается среди многофункциональных белков?

Параметры поиска (Caryophanaceae): (taxonomy_id:186818) AND (keyword:KW-0511) AND (cc_subunit:[тип])

Четвертичная структура Количество Основные EC-классы
Гомодимер362Гидролазы 38%, Трансферазы 24%
Мономер130Гидролазы/Лиазы 47%
Гомогексамер115Трансферазы 100% (HprK/P — углеводный обмен)
Гомотример110Трансферазы 100% (GlmU — биосинтез клеточной стенки)
Гетеротетрамер65Трансферазы 100% (ArgJ — биосинтез аргинина)
Гомотетрамер9Изомеразы/Лиазы 50%
Гетеродимер0

Таким образом, с точки зрения логики, все четвертичные структуры многофункциональных бактериальных белков можно разделить на три группы.

Первую, самую многочисленную группу (более 75%) составляют простые структуры: мономеры, гомодимеры и гомотримеры. Среди них абсолютно доминируют гомодимеры (почти половина всех белков), так как они обеспечивают оптимальный баланс между стабильностью, наличием двух активных центров и экономичностью сборки. Мономеры встречаются в три раза реже из-за наличия только одного активного центра. Гомотримеры также встречаются реже гомодимеров — примерно в три раза, поскольку сборка трёх субъединиц требует больше энергозатрат без пропорционального выигрыша в функциональности.

Вторую группу (около 15%) составляют гомогексамеры. Несмотря на высокую сложность сборки, они почти догнали по частоте гомотримеры. Их преимущество — кольцевая структура, способная образовывать внутренний канал или метаболический тоннель для субстрата, что обеспечивает уникальную эффективность, недоступную димерам и тримерам.

Третью группу (менее 10%) составляют редкие и специализированные структуры: гетеротетрамеры и гомотетрамеры. Гетеротетрамеры встречаются в заметном, но небольшом количестве (около 8%), что говорит о наличии у них какой-то специализированной функции, требующей двух типов субъединиц. Гомотетрамеры практически отсутствуют (всего 1%) — вероятно, потому что они не дают значимых преимуществ ни перед гомодимерами, ни перед гомогексамерами. Гетеродимеры полностью отсутствуют (0%), что для бактерий характерно: координация синтеза двух разных субъединиц в равных количествах слишком сложна, и природа предпочитает либо гомодимеры, либо более крупные гетеромультимеры.