Исследование структур трансмембранных белков

Таблица 1

PDB код Число цепей Тип
(спираль, баррель)
Число трансмембранных участков в цепи Число остатков в одном трансмембранном участке
(типичное, минимальное, максимальное)
2a06 20 цепей альфа-спирали 8 Для цепи C: типичное - 22; минимальное - 20; максимальное - 25 (в иных цепях доходит до 31);
1by3 1 бета-баррель 22 типичное - 7; минимальное - 6; максимальное - 8;

Существует много красивых структур: 3m9s (просто красивая вещь; обладает 17 альфа-спиралями в одной цепи (рекорд для PDBTM); В природе многие вещи симметричны (если не вглядываться в детали). 2xq2 и 2a06 обладают двумя плоскостями симметрии благодаря как раз альфа-спиралям. Забавна структура 1a11, демонстрирующая структуру одной спирали (правда, является лишь сегментом большего белка, но любопытно). Но наиболее значимые числа спиралей, на которые выдается большое число структур - около 10. Меньшее число может быть сегментом большего белка, но в то же самое время белка, у которого в одной цепи более 17 спиралей, также не существует

Что же касается бета-баррелей, то здесь наименьшее число трансмембранных участков - 2. Но в таком случае они всегда в больших количествах (3m2l. Мне напоминает торт). У белков с бета-баррелями может существовать внутренняя мембрана (пример: 1by3). Минимальное число бочек для того, чтобы лишь одна цепь обладала бета-баррелями - 8 (2flt). К слову, существуют лишь белки с 19 бета-баррелями (из белков с нечетным числом баррелей до 23). Таких белков три (например, 2k4t). И, наконец, стоить отметить 2kc3 - этот "белок" трансмембранный, но у него не альфа-спираль и не бета-баррель. Что же находится на их месте - не указано

Описание трансмембранных участков P24181


Предсказание TMHMM

Как видно из него, здесь - 12 трансмембранных участков, все - альфа-спирали

Аннотация Uniprot: здесь также 12 трансмембранных участков

Выравнивание также показало 12 трансмембранных участков

белок 2v50

Сравнивая полученные координаты, было обнаружено следующее:

  • Наиболее аккуратные значения выдает Uniprot. Его координаты находятся в пределах 20-24 аминокислотных остатков.
  • Средняя длина трансмембранных участков по выравниванию значительно ниже нормы - если брать за трансмембранные участки консервативные позиции.
  • Предсказанное TMHMM приближено к Uniprot-координатам, однако явная ошибка в самом конце.

    Сравнение координат в файле Excel

      Число а.к. остатков
    Всего а.к. остатков в последовательности 1034
    Остатки, предсказанные TMHMM как локализованные в мембране (всего) 107
    Правильно предсказали - совпадают с 3D предсказанием (true positives, TP) 106
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным 3D таковыми не являются, false positives, FP) 24
    Правильно не предсказали ( не предсказаны, и по данным 3D не находятся в мембране, true negatives, TN) 624
    Не предсказали то, что нужно (остатки по данным 3D находятся в мембране, false negatives, FN) 1
    Чувствительность (sensivity) = TP / (TP+FN) 0,99
    Специфичность (specificity) = TN / (TN+FP) 0,96
    Точность(precision) = TP /(TP+FP) 0,82
    Сверхпредсказание = FP/ (FP+TP) 0,18
    Недопредсказание = FN / (TN+FN) 0,016

    Если просуммировать получившиеся предсказанные аминокислотные остатки, то можно обнаружить, что их меньше 1034. Это вызвано довольно длинными трансмембранными белками.

    В целом, это крайне удачные методы для предсказания трансмембранности белка. Последний метод радует высокими значениями чувствительности и специфичности, да и точность вполне удачная

    Назад