Практикум 7. Трансмембранные белки

1. Информация о выбранном белке

Я работал с данным мне из таблицы белком 6ln7. Он представляет из себя Mg-зависимую АТФ-азу P-типа, использующую энергию АТФ для активного транспорта ионов Ca2+ из цитоплазмы в люмен саркоплазматического ретикулума. Играет ключевую роль в мышечном расслаблении и кальциевом гомеостазе клетки.

Таблица 1. Сводка о белке

Название (рус.)Кальциевая АТФаза саркоплазматического/эндоплазматического ретикулума 2 (SERCA2, изоформа)
Название (англ.)Sarcoplasmic/endoplasmic reticulum calcium ATPase 2 (SERCA2b)
PDB ID6LN7
UniProt ACP16615
ГенATP2A2
ОрганизмHomo Sapiens
Локализация в клеткеМембрана саркоплазматического ретикулума и эндоплазматического ретикулума (SR/ER-мембрана)

Последовательность белка (каноническая изоформа 1, 1042 a.a.) была взята из UniProt (P16615).

Структура 6LN7

Рис. 1. Трехмерная структура 6LN7. Синим обозначен внутренний липидный слой, красным – внешний.

2. Трансмембранные участки по данным OPM (Orientations of Proteins in Membranes)

Для белка SERCA2 (PDB 6LN7) в базе OPM определены следующие трансмембранные сегменты. Информация получена со страницы записи о 6LN7.

В общей сложности 11 трансмембранных α-спиралей, что типично для P-тип АТФ-аз. Границы определены по положению белка относительно рассчитанной гидрофобной толщины липидного бислоя

Таблица 2. Список трансмембранных участков для 6LN7 согласно базе данных OPM. Цепь A, нумерация согласно канонической последовательности UniProt P16615

Номер спиралиНачалоКонецДлина (a.a.)
TM1597921
TM28510521
TM325927921
TM428831326
TM575878023
TM678880619
TM783285322
TM889591420
TM992994820
TM1096598622
TM111013102917

3. Предсказания трансмембранных участков с помощью DeepTMHMM

Для предсказания использовалась та же каноническая последовательность UniProt P16615 (изоформа 1, 1042 а.о.) = в формате FASTA. Сервис DeepTMHMM был запущен с параметрами по умолчанию (модель Alpha-globular). Результаты работы были сохранены в файле TMRs.gff3

Были определены 11 трансмембранных α-спиралей, столько же, сколько и при использовании OPM.

Таблица 2. Список трансмембранных участков для 6LN7 согласно базе данных OPM. Цепь A, нумерация согласно канонической последовательности UniProt P16615

Номер спиралиНачалоКонецДлина (a.a.)
TM1607617
TM28810821
TM325627621
TM429631419
TM576278221
TM678780721
TM783685621
TM889591521
TM993094920
TM1096698621
TM111018103013

Графическое представление результатов DeepTMHMM

На Рис. 2.  показаны апостериорные вероятности принадлежности каждого положения к трём состояниям: Inside (внутри, цитоплазма), Membrane (мембрана) и Outside (снаружи, люмен SR/ER). Отчётливо видны 11 пиков, соответствующих трансмембранным спиралям.

DeepTMHMM posterior probabilities

Рис. 2. Предсказание трансмембранных участков белка SERCA2 (P16615) с помощью DeepTMHMM.

4. Качественное сравнение результатов OPM и DeepTMHMM

Оба метода – OPM, основанный на трёхмерной структуре и расчётном позиционировании в липидном бислое, и DeepTMHMM, работающий только с аминокислотной последовательностью, – предсказали одинаковое число трансмембранных спиралей (11). Практически все спирали перекрываются на 80-100% своей длины. Расхождения составляют от 1 до 8 аминокислотных остатков на N- или C-концевых участках спирали. Например:

Расхождения можно объяснить несколькими факторами:

  1. Физическая основа методов разная: OPM определяет трансмембранный участок как часть цепи, погруженную в гидрофобное ядро бислоя с учетом точной атомной структуры. DeepTMHMM опирается только на статистические закономерности в последовательностях, выявленных на основе множества белков с известной топологие, и предсказывает положение спирали исключительно на основании последовательности белка.
  2. Концевые участки спиралей часто содержат амфифильные или полярные остатки, которые находятся на липидно-водой границе. OPM и DeepTMHMM могут по-разному интерпретировать положения этих остатков, считая или не считая их находящимися внутри мембран
  3. Вследствие погрешности обучения DeepTMHMM может незначительно смещать границы трансмембранных сегментов, если в тренировочныых даных распределение длин определенных спиралей имело систематический тренд.

Несмотря на расхождения, можно сделать вывод, что предсказание глубокого обучения успешно воспроизводит структурные данные о трансмембранной топологии SERCA2, подтверждая надёжность обоих подходов. Все 11 трансмембранных элементов надёжно идентифицируются, а небольшие различия в границах не превышают погрешностей, типичных для методов предсказания мембранной топологии.