Четвертый семестр
Мембранные белки
Задание - предсказать топологию мембранного белка и сравнить предсказание с ориентированной в мембране 3D-структурой белка-прототипа.
Белок для исследования |
Белок-прототип |
|
AC UniProt |
AC UniProt |
PDB ID |
Q6L372 |
P83791 | 1VF5, цепь A |
цитохром b6 (Saccharum hybrid cultivar) |
цитохром b6 (Mastigocladus laminosus) |
Так как последовательности из БД PDB и БД UniProt могут различаться, то сначала были сравнены две найденные последовательности белка-прототипа. Было построено попарное выравнивание. Последовательности полностью совпадают.
Затем были попарно выравнены последовательности белка-прототипа и заданного белка. ID составило 76%. Снижение идентичности произошло из-за различия в длине последовательностей (215 и 234 а.о.) - вначале последовательности-прототипа стоит 29 гэпов.
Готовое выравнивание было импортировано в GeneDoc и сохранено в файле marking.msf.
В БД OPM было найдено описание расположения белка-прототипа в мембране (он расположен в мембране тилакоида). Для цепи А описано
4 трансмембранных сегмента:
33-53, 88-109, 115-134, 185-205 (указаны позиции а.о. в последовательности).
С помощью Jmol были определено расположение цитоплазматических цепей. Опция Hide позволяет оставить на изображении только цепь А. Номера аминокислотных остатков определяются автоматически нажатием мышки. Таким образом были определены следующие положения для
цитоплазматичеких петлей:1-32, 110-114, 206-215.
В файле marking.msf ниже последовательности прототипа была добавлена последовательность с названием "OPM" и разметкой TM сегментов.
Программа TMHMM для исследуемого белка предсказала следующее расположение в мембране - см. результаты.
Цитоплазматические петли предсказаны как inside, трансмембранные участки - TMhelix. В выравнивание была добавлена искусственная последовательность TMHMM, отражающая полученные данные .
Полученное выравнивание:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 6 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 8 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 0 | 0 |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Q | 6 | L | 3 | 7 | 2 |   |   |   |   |   | : |   | M | S | M | K | F | S | Y | T | V | L | G | G | G | V | G | L | V | T | Y | L | N | K | V | Y | D | W | F | E | E | R | L | E | I | Q | A | I | A | D | D | I | T | S | K | Y | V | P | P | H | V | N | I | F | Y | C | L | G | G | I | T | L | T | C | F | L | V | Q | V | A | T | G | F | A | M | T | F | Y | Y | R | P | T | V | T | E | A | F | S | S | V | Q | Y | I | M | T | E | A | N | F | G | W | L | I | R | S | V | H | R | W | S |   | : |   | 1 | 0 | 8 |
1 | V | F | 5 | _ | A |   |   |   |   |   | : |   | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | M | A | N | V | Y | D | W | F | Q | E | R | L | E | I | Q | A | L | A | D | D | V | T | S | K | Y | V | P | P | H | V | N | I | F | Y | C | L | G | G | I | T | L | T | C | F | L | I | Q | F | A | T | G | F | A | M | T | F | Y | Y | K | P | T | V | T | E | A | Y | A | S | V | Q | Y | I | M | N | E | V | S | F | G | W | L | I | R | S | I | H | R | W | S |   | : |   |   | 8 | 9 |
O | M | P |   |   |   |   |   |   |   |   | : |   | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H |   | : |   |   | 2 | 3 |
T | M | H | M | M |   |   |   |   |   |   | : |   | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H |   | : |   |   | 2 | 9 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | h |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 6 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 8 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 0 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   |   |   |   |   |
Q | 6 | L | 3 | 7 | 2 |   |   |   |   |   | : |   | A | S | M | M | V | L | M | M | I | L | H | V | F | R | V | Y | L | T | G | G | F | K | K | P | R | E | L | T | W | V | T | G | V | V | L | A | V | L | T | A | S | F | G | V | T | G | Y | S | L | P | W | D | Q | I | G | Y | W | A | V | K | I | V | T | G | V | P | E | A | I | P | V | I | G | S | P | L | V | E | L | L | R | G | S | A | S | V | G | Q | S | T | L | T | R | F | Y | S | L | H | T | F | V | L | P | L | L | T | A | V |   | : |   | 2 | 1 | 6 |
1 | V | F | 5 | _ | A |   |   |   |   |   | : |   | A | S | M | M | V | L | M | M | I | L | H | V | F | R | V | Y | L | T | G | G | F | K | K | P | R | E | L | T | W | I | S | G | V | I | L | A | V | I | T | V | S | F | G | V | T | G | Y | S | L | P | W | D | Q | V | G | Y | W | A | V | K | I | V | S | G | V | P | E | A | I | P | V | V | G | V | L | I | S | D | L | L | R | G | G | S | S | V | G | Q | A | T | L | T | R | Y | Y | S | A | H | T | F | V | L | P | W | L | I | A | V |   | : |   | 1 | 9 | 7 |
O | M | P |   |   |   |   |   |   |   |   | : |   | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | + | + | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H |   | : |   |   | 7 | 6 |
T | M | H | M | M |   |   |   |   |   |   | : |   | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | + | + | + | + | + | + | + | + | + | + | + | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | H | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | H | H | H | H | H | H | H | H | H | H | H | H | H | H |   | : |   |   | 8 | 3 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | H |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | H |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   | 2 | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   |   |   |
Q | 6 | L | 3 | 7 | 2 |   |   |   |   |   | : |   | F | M | L | M | H | F | P | M | I | R | K | Q | G | I | S | G | P | L |   | : |   | 2 | 3 | 4 |
1 | V | F | 5 | _ | A |   |   |   |   |   | : |   | F | M | L | L | H | F | L | M | I | R | K | Q | G | I | S | G | P | L |   | : |   | 2 | 1 | 5 |
O | M | P |   |   |   |   |   |   |   |   | : |   | H | H | H | H | H | H | H | H | + | + | + | + | + | + | + | + | + | + |   | : |   |   | 8 | 4 |
T | M | H | M | M |   |   |   |   |   |   | : |   | H | H | H | H | H | H | H | H | H | + | + | + | + | + | + | + | + | + |   | : |   |   | 9 | 2 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | H |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Для определения качества предсказания не рассматривалась та часть последовательности, которой в выравнивании соответствуют гэпы в последовательности белка-прототипа.
Результаты предсказания топологии мембранного заданного белка
Число а.к. остатков | |
Всего а.к. остатков | 234 а.о. |
Остатки, предсказанные как локализованные в мембране (всего) | 92 |
Правильно предсказали (true positives, TP) | 78 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 14 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 142 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 6 |
Чувствительность (sensivity) = TP / (TP+FN) | 92,9% |
Специфичность (specificity) = TN / (TN+FP) | 91% |
Точность (precision) = TP / (TP+FP) | 84,8% |
Сверхпредсказание = FP/ (FP+TP) | 15,2% |
Недопредсказание = FN / (TN+FN) | 4% |
Можно сделать вывод, что программа ТМНММ имеет высокое качество предсказания. Точность алгоритма также очень высокая = 85%, а недопредсказание также оказывается очень низким - 4%, так как довольно хорошо определяется принадлежность каждого участка последовательности к определенному сегменту трансмембранного белка. Можно отметить, что для программы свойственно удлинение предсказываемых трансмембранных сегментов, и их редкий пропуск.