Построение HMM-профиля подсемейства дегидрогеназ внутри семейства COX14
1. Обзор семейства
- ID: COX14
- Accession: PF14880
- Описание: Семейство включает белки COX14, играющие важную роль в сборке митохондриальной цитохром-с-оксидазы.
- Количество последовательностей: Seed — 33, Full — 1542.
2. Подсемейство
Признак выделения: Подсемейство выделено по домену NAD_Gly3P_dh_N (5 -172). В качестве подсемейства выбраны белки, обладающие сложной архитектурой: NAD_Gly3P_dh_N + NAD_Gly3P_dh_C + COX14.
Профиль: HMM-модель построена на основе выравнивания 11 последовательностей домена NAD_Gly3P_dh_N (PF01210), вырезанных из белков данного подсемейства. Длина модели соответствует границам вырезанного домена.
3. Оптимальный порог
Выбранный порог: 300 (Bit-score) (можно и ниже: в списке находок, только подходящие последовательности)
4. Численные характеристики
| Подсемейство NAD_Gly3P_dh_N | Остальные белки COX14 | |
|---|---|---|
| Score >= 300.0 | 12 (TP) | 0 (FP) |
| Score < 300.0 | 0 (FN) | 2177 (TN) |
Выводы:
- TP (12): Профиль успешно идентифицировал все 11 исходных белков подсемейства и один дополнительный белок с высокой гомологией (>300 бит). Еще был найден один белок однако он был "Uncharacterized" и я решил не относить его ни к какому типу находок (хотя судя по высоким результатом, он тоже скорее всего является верноположительной находкой).
- FP (0): Ложных срабатываний выше порога среди 2190 последовательностей семейства COX14 не обнаружено.
- Результат: Построение профиля по специфичному домену дегидрогеназы позволило создать высокоселективную модель для поиска конкретной функциональной группы внутри семейства COX14.