Простейший профиль: частотная матрица.
Построение частотной матрицы (профиль) по участку выравнивания программой prophecy
Выравнивание участка-паттерна

Файл prophecy c порогом 30
Файл содержит длину паттерна, консенсус, максимальный счет и частотную матрицу.
Поиск участков в бактериальных белках из Swiss-Prot, дающих счёт выше 30 при сравнении с созданным моим профилем
Файл profit
Файл Excel со всеми находками
Находок с счетом >40 - 1291
Находок с счетом >50 - 609
Находок с счетом >60 - 574
Находок с счетом >70 - 295
Анализ списка находок и сравнение его со списком всех белков подсемейства
Файл Excel
На листе 2 содержатся 110 белков подсемейства.
Число верных находок ("True positive hits", TP)=62
Число ложных находок ("False positive hits", FP)=1229
Число ненайденных белков подсемейства (ложноотрицательных результатов, "False negatives", FN)=48
Чувствительность TP/(TP+FN)=0,56
Селективность TP/(TP+FP)=0,048

Чтобы чувствительность была равна около 96 % нужно взять порог 70
Чтобы селективность была около 100% нужно взять порог 100
Вернуться на страничку 4 семестра
© Сливко-Кольчик