на главную страницу
Задание 1
Построение частотной матрицы было произведено вырезанием выравнивания, содержащее паттерн для белков нужного таксона Bacilliales.
Затем была применена программа prophecy с измененным параметром "Enter thresold reporting percentage = 30".
Участок выравнивания
Частотная матрица по участку выравнивания
Задание 2
22 хита имеет процент от максимально возможной суммы равный 100. 10072 хитов имеет процент болше (или равно) 40;
1064 имеет процент выше 50; 387 хитов имеет процент выше 60%.
Задание 3
Характеристика всего списка белков, т.е. с порогом для анализа - 40% percentage.
True positive hits, TP - 47
False positive hits, FP - 10025
False negatives FN - 0
Чувствительность TP/(TP+FN) - 1
Селективность TP/(TP+FP) - 0,4664%
Анализ нужно провести по порогу такому, что селективность (отношение числа последовательностей найденных к правильным)
была равна (приближена) к селективности при поиске по моему паттерну.
Селективность (по моему паттерну): 42/47=89,3617%
Порог для анализа - 92% percentage.
True positive hits, TP - 42
False positive hits, FP - 16
False negatives FN - 0
Чувствительность TP/(TP+FN) - 1
Селективность TP/(TP+FP) - 72,4138%
ROC-кривая для результатов поиска белков в диапозоне от 40 процентов.
Результаты поиска с колонками FP и TP, селективность и чувствительность
Вывод: чувствительность паттерна была равна 89,3617% при селективности 1. Чувствительность профиля при данной селективности равно 72,4138%.
Т.о. в моем случае паттерн оказался лучше профиля.
©Джумашев