На страницу четвертого семестра
Были получены последовательности белка-прототипа из БД PDB и БД Uniprot. Последовательность из PDB начинается с 9 остатка вместо 1 и заканчивается 233 (тогда как должна 269). Также в описании pdb можно найти сведения о том, что данные остатки не были использованы в эксперименте, то есть закристаллизована последовательность с 9 до 233. Однако, нумерация остатков не меняется.
На изображении есть красная и синяя черта. То, что выше красной черты, находится вне клетки, то, что за пределами синей - находится, соответственно, в цитоплазматической части. Таким образом внутри клетки (цитоплазматические петли) оказываются 9-10, 69-76, 88-91, 157-167, 232-233 (розовый цвет), а с внешней стороны: 32-49, 112-138, 185-192, 200-209 (желтый цвет).
Добавив к выравниванию белка-прототипа и исследуемого белка строку с предсказанием ТМНММ, а также строку с данными ОРМ, можно получить выранивание такого вида:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 6 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 8 | 0 |   |   |   |   |   |   |   |   |   |
Q | 6 | 6 | L | N | 3 | _ | C | O | T |   | : |   | M | A | S | E | F | K | K | K | M | F | W | R | A | V | V | A | E | F | L | A | M | I | L | F | I | F | I | S | I | G | S | A | L | G | F | N | F | P | V | S | V | N | G | T | S | A | T | Q | D | N | V | K | V | S | L | A | F | G | L | S | I | A | T | M | A | Q | S | V | G | H | I | S | G | A | H | L | N | P | A | V | T | L | G |   | : |   |   | 8 | 3 |
A | Q | P | 1 | _ | H | U | M | A | N |   | : |   | - | - | - | - | - | - | - | - | L | F | W | R | A | V | V | A | E | F | L | A | T | T | L | F | V | F | I | S | I | G | S | A | L | G | F | K | Y | P | V | G | - | N | N | Q | T | A | V | Q | D | N | V | K | V | S | L | A | F | G | L | S | I | A | T | L | A | Q | S | V | G | H | I | S | G | A | H | L | N | P | A | V | T | L | G |   | : |   |   | 7 | 4 |
O | P | M |   |   |   |   |   |   |   |   | : |   | - | - | - | - | - | - | - | - | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | + | + | + | + | + | + | + | H | H | H | H | H | H |   | : |   |   | 4 | 6 |
T | M | H | M | M |   |   |   |   |   |   | : |   | + | + | + | + | + | + | + | + | + | + | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | + | + | + | + | + |   | : |   |   | 4 | 6 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 0 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 6 | 0 |   |   |   |   |   |   |   |   |   |   |   |   |
Q | 6 | 6 | L | N | 3 | _ | C | O | T |   | : |   | L | L | L | S | C | Q | I | S | I | F | K | A | L | M | Y | I | L | A | Q | C | L | G | A | V | V | A | T | A | I | L | S | G | V | T | S | S | L | P | Y | N | S | L | G | L | N | A | L | A | K | G | I | N | A | G | Q | G | L | G | I | E | I | I | A | T | L | Q | L | V | L | C | V | L | A | T | T | D | R | R | R | N | D | V | T |   | : |   | 1 | 6 | 6 |
A | Q | P | 1 | _ | H | U | M | A | N |   | : |   | L | L | L | S | C | Q | I | S | I | F | R | A | L | M | Y | I | I | A | Q | C | V | G | A | I | V | A | T | A | I | L | S | G | I | T | S | S | L | T | G | N | S | L | G | R | N | D | L | A | D | G | V | N | S | G | Q | G | L | G | I | E | I | I | G | T | L | Q | L | V | L | C | V | L | A | T | T | D | R | R | R | R | D | L | G |   | : |   | 1 | 5 | 7 |
O | P | M |   |   |   |   |   |   |   |   | : |   | H | H | H | H | H | + | + | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | + | + | + | + | + | + | + | + |   | : |   |   | 8 | 9 |
T | M | H | M | M |   |   |   |   |   |   | : |   | + | + | + | + | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | + | + | + | + | + | + | + | + | + |   | : |   |   | 9 | 2 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 8 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 0 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 4 | 0 |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Q | 6 | 6 | L | N | 3 | _ | C | O | T |   | : |   | G | S | A | P | L | A | I | G | L | S | V | A | L | G | H | L | L | A | I | D | Y | T | G | C | G | I | N | P | A | R | S | F | G | S | A | L | I | A | N | N | F | E | N | H | W | I | F | W | V | G | P | I | I | G | G | A | G | A | A | L | I | Y | D | F | I | L | A | P | R | S | S | D | L | T | D | R | V | K | V | W | T | S | G |   | : |   | 2 | 4 | 9 |
A | Q | P | 1 | _ | H | U | M | A | N |   | : |   | G | S | A | P | L | A | I | G | L | S | V | A | L | G | H | L | L | A | I | D | Y | T | G | C | G | I | N | P | A | R | S | F | G | S | A | V | I | T | H | N | F | S | N | H | W | I | F | W | V | G | P | F | I | G | G | A | L | A | V | L | I | Y | D | F | I | L | A | P | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |   | : |   | 2 | 2 | 5 |
O | P | M |   |   |   |   |   |   |   |   | : |   | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |   | : |   | 1 | 3 | 5 |
T | M | H | M | M |   |   |   |   |   |   | : |   | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + |   | : |   | 1 | 3 | 8 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 6 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |
Q | 6 | 6 | L | N | 3 | _ | C | O | T |   | : |   | Q | V | E | E | Y | D | L | E | G | D | D | M | N | S | R | V | E | M | K | P | K |   | : |   | 2 | 7 | 0 |
A | Q | P | 1 | _ | H | U | M | A | N |   | : |   | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |   | : |   |   |   | - |
O | P | M |   |   |   |   |   |   |   |   | : |   | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |   | : |   |   |   | - |
T | M | H | M | M |   |   |   |   |   |   | : |   | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + |   | : |   |   |   | - |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
На данном выравнивании буквы Н означают принадлежность остатка к внутримембранному типу, знак "+" определяет остаток, как принадлежащий цитоплазматической петле, а "-" - это все остальные остатки.То же выравнивание в формате Clustal.
Результаты предсказания топологии мембранного белка Aquaporin-1 | Число а.к. остатков |
Всего а.к. остатков | 270 |
Остатки, предсказанные как локализованные в мембране (всего) | 138 |
Правильно предсказали (true positives, TP) | 110 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 28 |
Правильно не предсказали (не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 106 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 25 |
Чувствительность (sensivity) = TP / (TP+FN) | 81.5% |
Специфичность (specificity) =TN / (TN+FP) | 79.1% |
Точность (precision) = TP / (TP+FP) | 79.7% |
Сверхпредсказание = FP/ (FP+TP) | 20.3% |
Недопредсказание = FN / (TN+FN) | 19.1% |
Таким образом, чувствительность и точность достаточно высокие, но на выравнивании наблюдается на 2 трансмембранных участка меньше, оба они вообще не предсказаны. Но также можно заметить, что "ошибки" этого предсказания могут и не быть ошибками в полной мере, так как ОРМ сделано для белка-прототипа, а не для исследуемого белка, что дает возможность отличия этих структур, а следовательно и отличия предсказания от разметки ОРМ.