На главную
К четвертому семестру
Построение частотной матрицы (профиль) по участку выравнивания программой prophecy
Файл prophecy
Файл содержит длину паттерна, консенсус, максимальный счет и частотную матрицу.
Поиск участков в бактериальных белках из Swiss-Prot, дающих счёт выше 30 при сравнении с созданным моим профилем
Файл profit
Анализ списка находок и сравнение его со списком всех белков подсемейства
Файл Excel
Число верных находок ("True positive hits", TP)=123
Число ложных находок ("False positive hits", FP) > 190 000 (!sic)
Число неверных находок превзошло все разумные пределы, но, к сожалению, немалая часть правильных
находок отсеивалась при повышении порога (ниже
порога 35 находится 70 находок из 123). Ввиду этого о какой-либо селективности
говорить бессмысленно (хотя она и посчитана в файле).
Я затрудняюсь объяснить причины произошедшего - все было проделано несколько раз,
была взята правильная часть выравнивания .
Само же выравнивание выбрано вполне корректно, что подтвержают как результаты предыдущего
задания (с вполне корректно работающим паттерном), так и следующего (pftools).