Практикум 10. HMM-профили и эволюционные домены

Выбор семейства и подсемейства Pfam

Было выбрно семейство белков 14-3-3

ID: 14_3_3

АС: PF00244

Последовательностей в seed 135

последовательностей в full 15944

14-3-3 - это семейство высококонсервативных белков, присутствующих во всех эукариотах. Они связывают фосфорилированные мотивы серина/треонина на белках-мишенях, регулируя их активность, локализацию и взаимодействия. Участвуют в контроле клеточного цикла, апоптоза, метаболизма и ответа на стресс. Домен 14-3-3 формирует структуру из четырёх α-спиралей (H3, H5, H7, H9), которая способствует связыванию с другими белками.

Как подсемейсво были выбраны белки с доменнной архиктетурой PF00244-PF00244-PF00244 всего таких беков 19

2026-05-12-21-30-57

Построение HMM-профиля

Были скачаны все последовательности подсемейства - 19 белков. Было сделано их выравнивание:

muscle -align protein-sequences.fasta -output alignment.fasta

Репрезентативным белком является A0A0L7RIW3_9HYME в нем координаты доменов следующие 12-197, 207-265, 278-367

Вырежем домен PF00244 c координатми 278-367, в выравнивании он находится на позициях 1767-1924

Далее это выравнивание использовалось для построения HMM-профиля

hmmbuild profile.hmm domain.fa

Далее были скачаны последовательности всех белков в семействе всего их 24000. Запустили поиск полученным HMM-профилем по этим белкам.

hmmsearch --tblout output_hmmsearch.txt profile.hmm protein-matching-PF00244.fasta
Полученный файл

Результаты только для белков подсемейства

A0A9P1GD15|unreviewed|14-3-3 448.4

A0A8K0EW92|unreviewed|14-3-3 385.3

A0A0L7RIW3|unreviewed|14-3-3 338.2

A0A0M8ZNI9|unreviewed|14-3-3 326.6

A0A9Q0N8J7|unreviewed|14-3-3 319.4

A0A8S9JNP4|unreviewed|14-3-3 310.9

A0AA88XJ62|unreviewed|14-3-3 309.3

A0A812S414|unreviewed|14-3-3 294.5

A0A2A3EA83|unreviewed|14-3-3 256.9

A0A5E4Q0G1|unreviewed|14-3-3 254.2

A0A498SDR0|unreviewed|14-3-3 244.2

A0A7K9U0M9|unreviewed|14-3-3 190.3

A0A914IEM9|unreviewed|14-3-3 173.8

A0A4V3SBU1|unreviewed|14-3-3 173.4

A0A8J7NSH0|unreviewed|14-3-3 162.1

A0A438KR68|unreviewed|14-3-3 141.4

A0A8H4J9U2|unreviewed|14-3-3 102.2

A0ABR2D223|unreviewed|14-3-3 100.0

A0A8H5FE97|unreviewed|14-3-3 81.0

максимальный вес 448.4 минимальный 81.0

hmmsearch обнаружил 22909 находок все 19 белков семейсва были найдены

Выбор порога

Был выран опимальный вес как 309.3, чтобы максимально снизить чило ложноположительных результатов. Профиль оказался малоспецифичным для данной доменной архитектуры

Таблица 2x2 для отчёта
Принадлежит подсемейству Не принадлежит подсемейству
Score ≥ 309.3 7 5
Score < 309.3 12 22885