Domains & Profiles
Прокариотическое семейство E2 A
Данное семейство белков относится к суперсемейству E2/UBC, обнаруженных у нескольких бактерий. Остатки активного центра очень похожи на эукариотические белки E2 (убиквитин-связывающие ферменты)[1,2]. Члены этого семейства обычно слиты с доменами E1 и JAB на С-конце домена E2. Белок обычно находится по соседству с геном, кодирующим отдельный белок семейства металлобеталактамаз, ферментов направленных на нейтрализацию бета-лактамных антибиотиков, таких ка пенициллин.
Ниже в табл. 1 представлены некоторые параметры двнного семейства.
Название домена | Seed | Full | Средняя длина | Сходство | Среднее покрытие | Число архитектур |
---|---|---|---|---|---|---|
Prok-E2_A | 6 | 151 | 140,9 | 21% | 19,72% | 6 |
В данной работе была исследована вторая по распространенности архитнектура, содержащая 28 белков. Помимо данного домена вблизи N-конца, она также содержит обрывок домена ThiF ближе к С-концу. Этот домен характерен для убиквитин-активирующих белков семейства E1, где домен многократно повторяется[3], и белков ThiF/MoeB/HesA.
Построение выравнивания
Для построения были использованы последовательности белков выбранной доменной архитектуры. Для начала были скачаны все последовательности семейства, а затем с помощью скрипта были выделены последовательности на основе списка 28 имен белков выбранной архитектуры. Эти последовательности были записаны в файл. Затем с помощью веб-версии MUSCLE было получено собственно выравниввание в формате fasta. Далее оно было обработано в программе Jalview (ссылка на проект). Там оно было обрезано до позиций 1–579 (Prok-E2_A: 6–183; ThiF: 374–582). Было решено оставить первые пять позиций, так как они оказались высококонсервативными, а последние позиции выравнивания были низкоконсервативными, и на них некоторые белки заканчивались. После этого были удалены белки со сходством более 90% и пять белков, занимающие до 579 позиций выравнивания из числа низкоконсервативных (ссылка на проект).
Построение HMM
На основе уже нового выравнивания и был построен HMM-профиль на локальной машине с помощью пакета HMMER (v3.3.2) командой hmmbuild hmm processed.fasta
. В этой версии пакета HMMER нормирование проводится сразу же, а нормировочные коэффициенты для разных распределений указаны в строках STATS.
Поиск доменов в белках
Далее был произведен поиск доменов по построенному HMM-профилю во всех последовательностях семейства с пороговым E-значением 0.1 с помощью команды hmmsearch -E 0.1 hmm full.fasta > entries
. Находки доступны по ссылке. Было найдено 35 белков с E-vlaue менее 1e-04. Дополнительная информация о каждой из находок доступна в табл. 2.
Находка | Группа | Вес | Е-value |
---|
Как видно из табл. 2, все белки из выборки для построения HMM-профиля были найдены, однако из 28 белков выбранного семейства были найдены только 26. Это A0A1I5B0H6 и A0L5E1. Обе из них сильно отличались по первым четырем позициям, не считая первой (формально они не входят в домен). Также A0L5E1 значительно короче остальных (463).
Проверка работы HMM-профиля
Ниже на рис. 3 представлены распределение весов (А), гистограмма длин (В), ROC-кривая (С) и F1-функции (D). Данные для графиков доступны в таблице По распределению весов видна четкая ступенька после веса 464,2. Данный вес был выбран в качестве порогового. По специфичности и чувствительности была построена ROC-кривая, которая полностью подтверждала сделанное предположение (от максимального счета по 464,2 значение чувствительности составляло 0). На графике функции F1 от веса также наблюдался спад после точки 464,2 включительно. Таким образом, за пороговое значение счета для отнесения находки к двухдоменной архитектуре было окончательно принято 464,2.
Библиография
[1] Iyer LM, Burroughs AM, Aravind L; , Genome Biol. 2006;7:R60.: The prokaryotic antecedents of the ubiquitin-signaling system and the early evolution of ubiquitin-like beta-grasp domains. PUBMED:16859499 EPMC:16859499
[2] Burroughs AM, Jaffee M, Iyer LM, Aravind L;, J Struct Biol. 2008;162:205-218.: Anatomy of the E2 ligase fold: implications for enzymology and evolution of ubiquitin/Ub-like protein conjugation. PUBMED:18276160 EPMC:18276160
[3] Lee I, Schindelin H;, Cell. 2008;134:268-278.: Structural insights into E1-catalyzed ubiquitin activation and transfer to conjugating enzymes. PUBMED:18662542 EPMC:18662542