Практикум 11. Домашнее задание
Выбор семейства доменов из Pfam для анализа
Я выбрала PF00004 ATPase family associated with various cellular activities (AAA) в качестве семейства для работы в рамках практикума.
Краткое описание семейства
-
AC: PF00004
-
ID: AAA
-
Seed: 207
-
Full: 182497
Белки семейства AAA часто выполняют шапероноподобные функции, способствуя сборке, функционированию или разборке белковых комплексов.
Подсемейство было выделено по доменной архитектуре: PF00004-PF17862.
Рисунок 1. Изображение подсемейства
Ниже приведены команды, которые выполнялись в консоле:
-
hmm2build -f out.hmm mafft.fa (построение профиля по seed подсемейства при помощи HMMER2)
-
hmm2calibrate out.hmm (калибровка)
-
hmm2search --cpu=1 out.hmm protein-matching-PF00004.fasta (без порога)
-
hmm2search --cpu=1 -T 200 out.hmm protein-matching-PF00004.fasta (поиск по аннотированным последовательностям семейства с порогом 200)
Ниже представлена таблица с численными характеристиками выделения подсемейства профилем:
Рисунок 2. Таблица с результатами