Четвертый семестр

Простейший профиль: частотная матрица

  1. Построение частотной матрицы (профиль) по участку выравнивания программой pophecy
  2. В файле - матрица, строка - одна позиция выравнивания 1->n, столбец - аминокислота A->Z.

  3. Поиск в бактериальных белках из Swiss-Prot участков, дающих счет выше 30 при сравнении с созданным профилем
    • Всего 470 437 находок
      Счет больше 40 - 35 371
      Счет больше 50 - 1 815
      Счет больше 60 - 650
      Ограничимся счетом 44 - 8 807 находок

    • Составлена сводная таблица в файле Excel, лист Своднтабл

  4. Анализ списка найденных белков, сравнение его со списком всех белков подсемейства
    • Число верных находок ("True positive hits", TP) = 154
      Число ложных находок ("False positive hits", FP) = 8 500
      Число ненайденных белков подсемейства (ложноотрицательных результатов, "False negatives", FN) = 0
      Чувствительность TP/(TP+FN) = 1
      Селективность TP/(TP+FP) = 0,018

    • Построена ROC-кривая в файле Excel
    • Селективность моего паттерна - 0,84, подобрала порог 86 с селективностью 0,75
      ROC-кривая для порога 86 в файле Excel

Четвертый семестр


© Migur Anzhela 2010