Трансмембранные белки
Знакомство с базой данных мембранных белков OPM
Целью первого задания являлось ознакомление с интерфейсом и системой классификации трансмембранных белков в базе данных (БД) OPM (Orientations of Proteins in Membranes), а также изучение представленности различных β-листовых белков в этой БД.
Всего в OPM выделено три основных типа мембранных белков: трансмембранные, периферические/полуинтегральные и пептиды.
В свою очередь, среди трансмембранных белков выделяют три класса: альфа-спиральные "polytopic"-белки, пересекающие мембрану два и более раз, "bitopic"-белки,
пересекающие мембрану ровно 1 раз, и, собственно, бета-складчатые трансмембранные белки. Среди представителей последнего класса наибольшее внимание привлёк
белок из суперсемейства газдерминов, а именно, газдермин D (GSDMD). Он состоит из 33 субъединиц и представляет собой порообразующий белок, играющий важную роль
при воспалительных процессах и раке, в частности, путём запуска пироптоза — одного из видов клеточной гибели (см. Рис. 1, 2).
На примере газдермина можно увидеть, что при описании белка OPM ссылается на сторонние базы данных, такие как PDB Sum, PDB, MSD и MMDB (см. Рис. 3.).
Глобально система классификации мембранных белков в OPM устроена следующим образом: всего в базе представлено 3 типа, среди них — 11 классов, среди них, в свою очередь, — 530 суперсемейств, внутри которых — 1090 семейств. Также можно искать белки в определённых видах организмов, которых в базе данных представлено целых 1056 штук, а также по локализации в конкретных клеточных компартментах (представлено 24 различных типа локализации, включая внеклеточную в результате секреции и неопределённую). Всего в этой БД представлено 8915 различных мембранных белков (см. Рис. 4.).
Сравнение результатов предсказаний трансмембранных участков по последовательности и по трёхмерной структуре в α-спиральном белке
Целью этого задания являлось сравнение результатов предсказаний трансмембранных участков по аминокислотной последовательности (с помощью веб-сервиса DeepTMHMM) и по пространственной структуре (координаты участков указаны в OPM) в выданном α-спиральном белке.
Для анализа был предложен цинковый белок-переносчик YiiP (Zinc transporter YiiP, PDB ID: 3J1Z, UniProt AC: Q8E919), осуществляющий обмен катионов цинка (а также кадмия и, возможно, железа) на протоны. Используется для выкачки цинка из цитоплазмы бактериальной клетки за счёт градиента протонов, например, с целью детоксикации. Локализован на внутренней мембране грам-отрицательных бактерий, в частности, палочек Shewanella oneidensis.
Данный белок является двухсубъединичным гомодимером, поэтому ниже приведены координаты трансмембранных участков для каждой из субъединиц (информация взята непосредственно из OPM):
P - Tilt: 8 - TM segments: 1 (21-37), 2 (43-55), 3 (90-110), 4 (120-139), 5 (152-166), 6 (181-196),
Q - Tilt: 20 - TM segments: 1 (313-328), 2 (339-353), 3 (387-409), 4 (416-436), 5 (448-461), 6 (477-490).
Параметр Tilt обозначает угол наклона главной оси белка относительно нормали к плоскости липидного бислоя.
Далее проводилось предсказание трансмембранных участков белка по его последовательности, взятой из UniProt (раздел Sequence), с помощью веб-сервиса DeepTMHMM (см. Рис. 5.).
Координаты предсказанных программой DeepTMHMM трансмембранных участков:
1 (13-36), 2 (40-62), 3 (82-103), 4 (119-137), 5 (160-173), 6 (182-200).
По приведённым результатам предсказания нетрудно заметить, что программа выдала столько же участков, сколько лежит в OPM, однако координаты предсказанных DeepTMHMM трансмембранных участков на 5-10 аминокислот отличаются от координат тех же участков, указанных в OPM. Такое отличие предсказания от реальности можно объяснить тем, что программа, представляющая собой нейросеть, предсказывая гидрофобные участки по последовательности, не располагает никакой информацией о пространственной структуре молекулы белка, и, следовательно, не учитывает, например, наклон субъединиц белка, из-за чего программа может обрезать гиброфобные участки там, где они на самом деле ещё находятся в мебране.
Визуализация перекрывания предсказанных трансмембранных участков и указанных в БД OPM приведена ниже (см. Рис. 6.).
База данных TCDB
TCDB (Transport Classification DataBase) — это международная база данных классификации белков-транспортёров. Признана стандартом
для анализа и идентификации именно транспортных белков. Эта БД имеет собственную уникальную систему иерархической классификации белков, основанную на т.н. TC-коде
(Transport Classification). Этот код представляет собой уникальный для каждого транспортного белка шифр (по аналогии с EC-кодом для ферментов), каждый компонент
которого уточняет классификацию белка по определённым свойствам:
Так, первая цифра указывает на класс транспортёра (канал, вторично/первично активный переносчик и т.п.), первая буква (второй компонент)
обозначает подкласс (различаются по способу использования энергии или механизму переноса), вторая цифра — семейство (различают группы эволюционно родственных белков),
третья цифра — подсемейство (более узкая филогенетическая группа внутри семейства) и последняя четвёртая цифра указывает на конкретный белок или комплекс с
определённой субстратной специфичностью. Таким образом, для описанных ранее в отчёте двух белков — бета-листового и альфа-спирального — TC-коды будут следующими:
1.C.123.1.1 для газдермина D и 2.A.4.7.5 для цинкового переносчика YiiP.
Отдельные веб-страницы белков содержат всю ключевую информацию о них, например,
название, описание основных функций, UniProt AC, длину, молекулярную массу, вид, в котором представлен, специфичный субстрат, последовательность,
ссылки на сторонние базы данных и даже предсказанные внутренней программой веб-сервиса трансмембранные участки (см. Рис. 7.)! Однако для разных белков может быть представлена
информация с разной степенью детализации, в зависимости от изученности и, наверное, научной значимости белка. Так, например, для YiiP было предсказано всего 5
TMs и все с немного отличающимися координатами от таковых в OPM или предсказанных DeepTMHMM (см. Рис. 8.), а для газдермина они вообще не указаны в БД, что и неудивительно,
учитывая сложную пространственную структуру белка.