Практикум 10

В данном практикуме рассмотрели семейство: PF02866, lactate/malate dehydrogenase, alpha/beta C-terminal domain. Семейство объединяет важнейшие метаболические ферменты, которые катализируют обратимое окисление малата до оксалоацетата с участием кофермента NAD(P)⁺. Эти белки играют критическую роль в цикле Кребса, глюконеогенезе и поддержании клеточного электрохимического баланса у представителей всех трех доменов. В выравнивании seed содержится 14 последовательностей, в full – 27374.

Подсемейство выделено по доменной архитектуре HSP70 - Ldh_1_N - Ldh_1_C - Ribosomal_L13 (PF00012 - PF00056 - PF02866 - PF00572). Репрезентативным белком является A0A077Z8E4 — Malate dehydrogenase, mitochondrial (Trichuris trichiura (Whipworm)).

Скачанный фаста файл с белками подсемейства содержит 27 последовательностей. Программой hmmscan нашли координаты домена HSP70:

hmmscan --domtblout domains.txt PF00012.hmm protein-sequences.fasta

Составили файл только с последовательностями доменов подсемейства и выровняли их программой muscle. Составили профиль:

hmmbuild --amino hmm.res domain_align.fasta

Белки рассматриваемого подсемейства есть только у нематод, поэтому искали по последовательностям животных. Запустили поиск:

hmmsearch -o hsp70_res.out hmm.res Metazoa.fasta

Всего нашлось 46 белков: 27 из них принадлежали нашему подсемейству (нашли все), остальные - подсемейству с доменной архитектурой HSP70 - Ldh_1_N - Ldh_1_C. Наименьшим весом (1360.4) обладает искомый белок и учитывая, что белки из другого подсемейства распределены случайно по весам порог оставим 1360.4

Таблица 1. Численные характеристики выделения подсемейства построенным HMM-профилем

Реальная принадлежность подсемейству
+ -
Предсказанная принадлежность подсемейству + 27 16
- 0 0