Простейший профиль: частотная матрица
- Построение частотной матрицы по участку выравнивания с помощью программы prophecy
Выходной файл содержит частотную матрицу. Каждая строка - одна позиция выравнивания,
каждый столбец - аминокислота (от A до Z).
Полное выравниваниебелков:
- Поиск учаcтков бактериальных белков из Swiss-Prot
-
Всего 565 592 находки.
Счёт более 40 имеют 40 718 находки
более 50 - 2 653
более 60 - 225
Счёт 100 имеют 22 находки
Далее я ограничилась находками, со счётом более 45 (9055 находок)
-
Составила сводную таблицу - количество строк уменьшилось. Примерно в 400 белках было найдено по два участка.
Файл Excel со сводной таблицей
Характеристики списка найденых белков (все):
Число верных находок ("True positive hits", TP) - 58
Число ложных находок ("False positive hits", FP) - 8801
Число ненайденных белков подсемейства ("False negatives", FN) - 0
Чувствительность TP/(TP+FN) - 1
Селективность TP/(TP+FP) - 0,0065
Характеристики списка найденых белков (только RL15):
Число верных находок ("True positive hits", TP) - 58
Число ложных находок ("False positive hits", FP) - 300
Число ненайденных белков подсемейства ("False negatives", FN) - 0
Чувствительность TP/(TP+FN) - 1
Селективность TP/(TP+FP) - 0,162
ROC-кривая:
Четвертый семестр
© Чернецова Даша