1. Сбор информации о ферменте
Мой фермент — OCTC_HUMAN, его EC-код 2.3.1.137: класс 2 — трансферазы (переносят функциональные группы и остатки от одной молекулы к другой); подкласс 2.3 — ацилтрансферазы (переносят ацильную группу); подподкласс 2.3.1 — переносящие группу, отличную от аминоацильной (пример заполнения категории по остаточному принципу).
Сам фермент 2.3.1.137 называется пероксисомная карнитин-О-октаноилтрансфераза; он переносит октаноильную группу (частный случай ацильной с восемью атомами углерода), соединенную с коферментом А, на молекулу L-карнитина (витамина B11). Кофермент А при этом отсоединяется.
Схема реакции выглядит так:
октаноил-КоА + L-карнитин ⇌ КоА + L-октаноилкартинин
2. Ферменты человека с близкими функциями
Всего, по результатам SRS, в SwissProt описано столько сходных человеческих ферментов:
- 1600 трансфераз
([swissprot-ECNumber:2.*] & [swissprot-Species:human])
; - 177 ацилтрансфераз (2.3.*);
- 153 (не-аминоацил)-ацилтрансфераз (2.3.1.*);
- 1 пероксисомальная карнитин-О-октаноилтрансфераза (2.3.1.137).
3. Проверка сохранения функции фермента у белков со сходными последовательностями
Запрос в SRS по SwissProt ([swissprot-Species:mouse] & [swissprot-ECNumber:2.*])
выдал 1383 результата; они были сохранены в файлы seq.fasta и ec.txt. Из них у 177 совпадает также подкласс (2.3.*); у 157 подподкласс; наконец, порядковый номер только у прямого гомолога OCTC_MOUSE.
Приведем названия белков к более удобному виду, затем выполним blastp:
sed -e "s/sp|.*|//" -e "s/ .*//" < seq.fasta > seq_proc.fasta makeblastdb -title "Mouse Transferases" -out mouse < seq_proc.fasta blastp -db mouse -evalue 1 -outfmt '7 sseqid evalue pident length mismatch' < OCTC_HUMAN.fasta | sed -e 's/\t/<td>/g' -e 's/^/<tr><td>/'
Результат:
Белок | E-value | % идентичности | Длина выравнивания | Несовпадений |
OCTC_MOUSE | 0.0 | 85.62 | 612 | 88 |
CACP_MOUSE | 8e-84 | 33.01 | 615 | 366 |
CLAT_MOUSE | 9e-71 | 29.65 | 607 | 397 |
CPT1A_MOUSE | 1e-67 | 30.27 | 631 | 379 |
CPT2_MOUSE | 2e-66 | 30.38 | 599 | 357 |
CPT1B_MOUSE | 2e-62 | 28.53 | 624 | 411 |
CPT1C_MOUSE | 2e-55 | 28.71 | 627 | 387 |
ECE2_MOUSE | 0.026 | 27.94 | 136 | 79 |
Из этого ряда сильно выбивается ECE2_MOUSE, так что его из рассмотрения исключаем. Остается семь ферментов — весьма очевидных гомологов (точнее, паралогов). Припишем каждому из них класс, делая результат наглядным:
Белок | E-value | Класс EC |
OCTC_MOUSE | 0.0 | 2.3.1.137 (карнитин-О-октаноилтрансфераза) |
CACP_MOUSE | 8e-84 | 2.3.1.7 (карнитин-О-ацетилтрансфераза) |
CLAT_MOUSE | 9e-71 | 2.3.1.6 (холин-О-ацетилтрансфераза) |
CPT1A_MOUSE | 1e-67 | 2.3.1.21 (карнитин-О-пальмитоинтрансфераза) |
CPT2_MOUSE | 2e-66 | 2.3.1.21 |
CPT1B_MOUSE | 2e-62 | 2.3.1.21 |
CPT1C_MOUSE | 2e-55 | 2.3.1.21 |
Не то чтобы отсюда можно было сделать хоть какие-то далеко идущие выводы, но результат ожидаемый. Если повысить e-value до десяти, то появляется еще три совпадения, но они явно случайны и столь же плохи, как и ECE2, так что рассматривать их не следует.