Hа Главную
Четвертый Семестр
Kodomo Home
Простейший профиль: частотная матрица
- Получение необходимых для анализа данных
- Построение профиля по участку выравнивания программой prophecy
- Поиск в бактериальных белках из Swiss-Prot участков, дающих счёт выше 30 при сравнении с созданным вами профилем profit
- Всего находок - 37236.
Счет больше 60 имеют 618 последовательностей.
Больше 50 - 639.
Больше 40 - 1137.
- Анализ найденных белков и со списком всех белков подсемейства
Был выбран порог 40, процесс постоения ROC-кривой отражен в таблице. ROC-кривая - это зависимость FP при всевозможных порогах от TP.
![](../image/roc.png)
Общие данные:
Верных находок профиля - 630, ложных - 499.
Число ненайденных белков подсемейства - 1.
Чувствительность профиля TP/(TP+FN) - 0,998.
Селективность TP/(TP+FP) - 0,558.
Селективность пaттерна выше селективности профиля. Селективности равны при пороге 41 (~0.74). Чувствительность же профиля 0.99 оказалась намного лучше чувствительности моего паттерна была равна 0,84. Если необходимо найти максимум нужных белков, а количество лишних не сильно важно, то профиль значительно лучше паттерна.
© Кузнецов Виктор Петрович