HMM профили доменов

Выбор домена и поиск семейства

Мы выбрали семейство Ubiquitin-conjugating enzyme E2-like IPR050113, являющееся подсемейством Ubiquitin-conjugating enzyme/RWD-like. Ферменты, конъюгирующие убиквитин, также известные как ферменты Е2 и реже как ферменты-переносчики убиквитина, выполняют вторую стадию реакции убиквитинирования, которая нацелена на расщепление белка с помощью протеасомы. В процессе убиквитинирования убиквитин, короткий белок, состоящий из 76 аминокислот, ковалентно присоединяется к остатку лизина в целевом белке. Как только белок помечен одной молекулой убиквитина, дополнительные этапы убиквитинирования формируют полиубиквитиновую цепь, которая распознается 19S-регуляторной частицей протеасомы, запуская АТФ-зависимое разворачивание белка-мишени, что позволяет перейти к 20S-основной частице протеасомы, где протеазы расщепляют мишень на короткие пептидные фрагменты для вторичной переработки в ячейке.

Рис.1 Убиквитин-опосредованный процесс деградации белков

В поиске по доменам мы выбрали домен Ubiquitin-conjugating enzyme PF00179. Убиквитинирование следует за конъюгацией убиквитина с консервативным остатком цистеина гомологов UBC. Этот домен состоит в клане гомологов UBC, в которых отсутствует цистеин этого активного центра.

Поиск сигналов и мотивов в представителях семейства

Мы скачали выровненные последовательности домена из seed и по ним составили HMM профиль:

hmmbuild ubuquitin_hmm ubiquitin    #Выдача

Затем мы скачали все аннотированные белки из семейства Ubiquitin-conjugating enzyme/RWD-like (476 штук) и в них поискали последовательности, которые лучше всего соответствуют предоставленному профилю:

hmmsearch  --domtblout ubi_res.tbl ubuquitin_hmm ubi_rev.fasta > ubisearch.txt       # Выдача

Лучшая находка:

Первые 35 находок да и в целом наиболее встречающийся белок в выдаче это различные варианты enzyme E2 2: enzyme E2-17 kDa, enzyme E2 1, enzyme E2 RAD6, enzyme E2 3 и другие.

Далее в выдаче встречается белок SUMO-conjugating. Параметры лучшей находки среди этого типа белков:

SUMO-conjugating (SUMOylation) — это обратимая посттрансляционная модификация, при которой небольшие белки-модификаторы, подобные убиквитину (SUMO), ковалентно присоединяются к остаткам лизина в белках-мишенях. Этот ферментативный процесс контролирует клеточные процессы, такие как ядерный транспорт, транскрипция, репарация ДНК и стабильность белка, посредством ферментативного каскада E1-E2-E3, упомянутого выше. Это интересно, так как в ходе реакции убиквинирования карбоксильная группа глицина-76 убиквитина образует изопептидную связь с аминогруппой лизина.

Анализ находок

Положительный класс = Ubiquitin-conjugating enzyme E2 (канонические E2, аннотированные как ubiquitin-conjugating)
Отрицательный класс = родственные, но не-E2: SUMO-конъюгирующие (UBC9), NEDD8-конъюгирующие (UBC12, UBE2F), UFM1-конъюгирующие, AKTIP, crossbronx, VPS37A и др.
66 последовательностей, не обнаруженных HMM совсем — считаются TN (не-E2, корректно пропущены)

HMM: найдено (+) HMM: не найдено (−) Итого
Аннотация: E2 убиквитин (истинный +) TP = 288 FN = 0 288
Аннотация: не-E2 (SUMO/NEDD8/др.) (истинный −) FP = 122 TN = 66 188
Итого 410 66 476