На главную
К четвертому семестру




Построение частотной матрицы (профиль) по участку выравнивания программой prophecy



Файл prophecy
Файл содержит длину паттерна, консенсус, максимальный счет и частотную матрицу.



Поиск участков в бактериальных белках из Swiss-Prot, дающих счёт выше 30 при сравнении с созданным моим профилем

Файл profit



Анализ списка находок и сравнение его со списком всех белков подсемейства

Файл Excel
Число верных находок ("True positive hits", TP)=123
Число ложных находок ("False positive hits", FP) > 190 000 (!sic)


Число неверных находок превзошло все разумные пределы, но, к сожалению, немалая часть правильных находок отсеивалась при повышении порога (ниже порога 35 находится 70 находок из 123). Ввиду этого о какой-либо селективности говорить бессмысленно (хотя она и посчитана в файле).

Я затрудняюсь объяснить причины произошедшего - все было проделано несколько раз, была взята правильная часть выравнивания . Само же выравнивание выбрано вполне корректно, что подтвержают как результаты предыдущего задания (с вполне корректно работающим паттерном), так и следующего (pftools).