Было выбрно семейство белков 14-3-3
ID: 14_3_3
АС: PF00244
Последовательностей в seed 135
последовательностей в full 15944
14-3-3 - это семейство высококонсервативных белков, присутствующих во всех эукариотах. Они связывают фосфорилированные мотивы серина/треонина на белках-мишенях, регулируя их активность, локализацию и взаимодействия. Участвуют в контроле клеточного цикла, апоптоза, метаболизма и ответа на стресс. Домен 14-3-3 формирует структуру из четырёх α-спиралей (H3, H5, H7, H9), которая способствует связыванию с другими белками.
Как подсемейсво были выбраны белки с доменнной архиктетурой PF00244-PF00244-PF00244 всего таких беков 19
Были скачаны все последовательности подсемейства - 19 белков. Было сделано их выравнивание:
muscle -align protein-sequences.fasta -output alignment.fasta
Репрезентативным белком является A0A0L7RIW3_9HYME в нем координаты доменов следующие 12-197, 207-265, 278-367
Вырежем домен PF00244 c координатми 278-367, в выравнивании он находится на позициях 1767-1924
Далее это выравнивание использовалось для построения HMM-профиля
hmmbuild profile.hmm domain.fa
Далее были скачаны последовательности всех белков в семействе всего их 24000. Запустили поиск полученным HMM-профилем по этим белкам.
hmmsearch --tblout output_hmmsearch.txt profile.hmm protein-matching-PF00244.fasta
Полученный файл
Результаты только для белков подсемейства
A0A9P1GD15|unreviewed|14-3-3 448.4
A0A8K0EW92|unreviewed|14-3-3 385.3
A0A0L7RIW3|unreviewed|14-3-3 338.2
A0A0M8ZNI9|unreviewed|14-3-3 326.6
A0A9Q0N8J7|unreviewed|14-3-3 319.4
A0A8S9JNP4|unreviewed|14-3-3 310.9
A0AA88XJ62|unreviewed|14-3-3 309.3
A0A812S414|unreviewed|14-3-3 294.5
A0A2A3EA83|unreviewed|14-3-3 256.9
A0A5E4Q0G1|unreviewed|14-3-3 254.2
A0A498SDR0|unreviewed|14-3-3 244.2
A0A7K9U0M9|unreviewed|14-3-3 190.3
A0A914IEM9|unreviewed|14-3-3 173.8
A0A4V3SBU1|unreviewed|14-3-3 173.4
A0A8J7NSH0|unreviewed|14-3-3 162.1
A0A438KR68|unreviewed|14-3-3 141.4
A0A8H4J9U2|unreviewed|14-3-3 102.2
A0ABR2D223|unreviewed|14-3-3 100.0
A0A8H5FE97|unreviewed|14-3-3 81.0
максимальный вес 448.4 минимальный 81.0
hmmsearch обнаружил 22909 находок все 19 белков семейсва были найдены
Был выран опимальный вес как 309.3, чтобы максимально снизить чило ложноположительных результатов. Профиль оказался малоспецифичным для данной доменной архитектуры
| Принадлежит подсемейству | Не принадлежит подсемейству | |
|---|---|---|
| Score ≥ 309.3 | 7 | 5 |
| Score < 309.3 | 12 | 22885 |