В данном практикуме рассмотрели семейство: PF02866, lactate/malate dehydrogenase, alpha/beta C-terminal domain. Семейство объединяет важнейшие метаболические ферменты, которые катализируют обратимое окисление малата до оксалоацетата с участием кофермента NAD(P)⁺. Эти белки играют критическую роль в цикле Кребса, глюконеогенезе и поддержании клеточного электрохимического баланса у представителей всех трех доменов. В выравнивании seed содержится 14 последовательностей, в full – 27374.
Подсемейство выделено по доменной архитектуре HSP70 - Ldh_1_N - Ldh_1_C - Ribosomal_L13 (PF00012 - PF00056 - PF02866 - PF00572). Репрезентативным белком является A0A077Z8E4 — Malate dehydrogenase, mitochondrial (Trichuris trichiura (Whipworm)).
Скачанный фаста файл с белками подсемейства содержит 27 последовательностей. Программой hmmscan нашли координаты домена HSP70:
hmmscan --domtblout domains.txt PF00012.hmm protein-sequences.fasta
Составили файл только с последовательностями доменов подсемейства и выровняли их программой muscle. Составили профиль:
hmmbuild --amino hmm.res domain_align.fasta
Белки рассматриваемого подсемейства есть только у нематод, поэтому искали по последовательностям животных. Запустили поиск:
hmmsearch -o hsp70_res.out hmm.res Metazoa.fasta
Всего нашлось 46 белков: 27 из них принадлежали нашему подсемейству (нашли все), остальные - подсемейству с доменной архитектурой HSP70 - Ldh_1_N - Ldh_1_C. Наименьшим весом (1360.4) обладает искомый белок и учитывая, что белки из другого подсемейства распределены случайно по весам порог оставим 1360.4
Таблица 1. Численные характеристики выделения подсемейства построенным HMM-профилем
| Реальная принадлежность подсемейству | |||
| + | - | ||
| Предсказанная принадлежность подсемейству | + | 27 | 16 |
| - | 0 | 0 | |