Четвертый семестр

Профили.

Сначала из выравнивания выборки выделили последовательности подсемейства (домены семейства PF08543 из белков таксона Proteobacteria c доменной архитектурой Phos_pyr_kin, TMP-TENI(двухдоменная)в отдельный файл.

На сервере kodomo воспользовались пакетом HMMER 2.3.2 для построения и калибровки профиль.
Программой hmm2search провели профилем поиск по всем белкам Uniprot, включающим хотя бы один домен семейства.

В таблице Excell приведены характеристики работы профиля при различных e-value:
e-value = 9,8E-20:
TP=93
FP=217
TN=3213
FN=0
При этом чувствительность равна 1, а избирательность 0,3.
e-value = 8,00E-101:
TP=12
FP=82
TN=3510
FN=81
При этом чувствительность равна 0,129032, а избирательность 0,12766.

По полученным данным мы можем сказать, что наша выборка, возможно, была недостаточной для характеризации специфичности данного подсемейства Pfam. Либо домен является не достаточно спецефичным для выделения его из всех белков с помощью полученного профиля.