Простейший профиль:частотная матрица
1.Построение частотной матрицы (профиля) по участку выравнивания программой prophecy
Участок выравнивания рибосомальных белков из Firmicutes, по которому был построен паттерн:

С помощью команды prophecy(входной файл-файл с данным участком, порог=30) была получена частотная матрица.
2.Поиск участков в бактериальных белках из Swiss-Prot, дающих счёт выше 30 при сравнении с созданным профилем
Для поиска была использована программа profit. Файл с находками.
(Percentage-процент от максимально возможной суммы).
Всего находок:67037
Находок больше 40:1458
Находок больше 50:298
Находок больше 60:209
Файл Excel cо списком найденных белков, при каждом из которых хранится максимальный из счетов его участков.
Анализ списка найденных белков и сравнение его со списком всех белков подсемейства
Был установлен порог=40.
Характеристики списка найденных белков:
- Число верных находок ("True positive hits", TP, то есть тех, которые присутствуют как в списке находок, так и в списке белков подсемейства):141
- Число ложных находок ("False positive hits", FP : белков, не принадлежащих подсемейству, но попавших в список находок; они же ошибки первого рода):1727
- Число ненайденных белков подсемейства (ложноотрицательных результатов, "False negatives", FN), или ошибок второго рода:1
- Чувствительность TP/(TP+FN):0,993
- Селективность TP/(TP+FP):0,0755
Под ROC-кривой в нашем случае понимается набор точек, чьи горизонтальные координаты равны числам FP при всевозможных (в некотором диапазоне) порогах, а вертикальные - соответствующим значениям TP. Если соединить точки, отвечающие соседним значениям порога, то получится ломаная, которая при большом числе находок выглядит как кривая.
Грубо говоря, чем выше расположена эта кривая, тем лучше наш профиль.
Таким образом, чувствительность профиля выше селективности созданного паттерна.
Для повышения селективности и сохранения нормального соотношения чувствительности и селективности можно взять порог=71(селективность=0,9366).
Главная страница
Страница четвертого семестра
© Naraykina Yulya,2011