Учебный сайт Вероники Мурашка


Практикум 9

A. Описание домена:

1. Идентификатор и название домена: PF09064, Tme5_EGF_like

2. Число белков с доменом в выборках seed - 3, full - 252, Uniprot - 492

3. Длина профиля HMM домена из Pfam

B. Описание архитектуры:

1. Идентификатор и название 2го домена - Lectin_C, PF00059

2. Число белков с архитектурой в вашем выравнивании - 24

score
Рис.1 Доменная архитектура

3. Команды построения профиля, калибровки, поиска по профилю

hmm2build HMM aln.fa
hmm2calibrate HMM
hmm2search --cpu=1 -E 1 HMM full.fasta> results.txt

4. Длина профиля HMM двухдоменной архитектуры

C. Сопроводительные материалы

1. Таблица с колонками:

(1) AC белков с доменом;

(2) отметка о выбранной архитектурой белка;

(3) отметка о включении белка в выравнивание для построения HMM Профиля

(4-5) для последовательностей, найденных вашим профилем вес находки и E-value

2. Файл c последовательностями full в fasta, использованные для поиска по профилю

3. Файл с выравниванием белков с выбранной архитектурой

4. Файл с выравниванием белков после ревизии, использованный для построения HMM профиля

5.HMM профиль после калибровки

6. Файл с результатами HMMsearch

C. Графики

score
Рис.2 Падение веса
score
Рис.3 ROC
score
Рис.4 F1
Таблица с результатами поиска по профилю и колонкой с отметкой, совпадает ли доменная архитектура с выбранной. И колонки: чувствительность при данном пороге и единица минус специфичность.