Простейший профиль: частотная матрица.

Построение частотной матрицы (профиль) по участку выравнивания программой prophecy

Выравнивание участка-паттерна

Файл prophecy c порогом 30
Файл содержит длину паттерна, консенсус, максимальный счет и частотную матрицу.

Поиск участков в бактериальных белках из Swiss-Prot, дающих счёт выше 30 при сравнении с созданным моим профилем

Файл profit
Файл Excel со всеми находками
Находок с счетом >40 - 1291
Находок с счетом >50 - 609
Находок с счетом >60 - 574
Находок с счетом >70 - 295

Анализ списка находок и сравнение его со списком всех белков подсемейства

Файл Excel
На листе 2 содержатся 110 белков подсемейства.
Число верных находок ("True positive hits", TP)=62
Число ложных находок ("False positive hits", FP)=1229
Число ненайденных белков подсемейства (ложноотрицательных результатов, "False negatives", FN)=48
Чувствительность TP/(TP+FN)=0,56
Селективность TP/(TP+FP)=0,048

Чтобы чувствительность была равна около 96 % нужно взять порог 70
Чтобы селективность была около 100% нужно взять порог 100
Вернуться на страничку 4 семестра
© Сливко-Кольчик