Практикум 12. Трансмембранные белки.

1. Знакомство с базой данных OPM

В базе данных OPM я выполнил запрос "porin" и выбрал первый белок из результатов поиска. Им оказался порин F внешней мембраны (Outer membrane porin F) Грам-отрицательной бактерии Pseudomonas aeruginosa. PDB ID: 4rlc; Uniprot ID: PORF_PSEAE

Таблица 1. Информация о порине F внешней мембраны из БД OPM
Толщина гидрофобной части белка в мембране24.2 Å
ЛокализацияВнешняя мембрана Грам-(-) бактерии
Координаты трансмембранных участков1(5-14), 2(28-35), 3(43-48), 4(68-77), 5(84-94), 6(112-122), 7(129-137), 8(150-158)
Среднее количество остатков в одном β-тяже белка8-10 аминокислот

На рисунке снизу внешняя сторона мембраны (p-сторона) обращена вниз, хорошо виден β-цилиндр, образованный восемью β-листами.

2. DeepTMHMM: Предсказание трансмембранных элементов по последовательности белка

Для дальнейшей работы я использовал выданный мне α-спиральный белок THIP_BRUA2 и β-цилиндрический белок PORF_PSEAE из прошлого задания этого практикума.

Перед обсуждением результатов вычислений DeepTMHMM приведу название выданного α-спирального белка - пермеаза системы транспорта тиамина ThiP (Thiamine transport system permease protein ThiP) Грам-отрицательной бактерии Brucella abortus. UniProt ID: THIP_BRUA2.

Изображение выше показывает выдачу DeepTMHMM для α-спирального белка ThiP. Верхний график показывает наиболее вероятное для каждого из остатков положение: с внешней, внутренней стороны клетки или в мембране. На нижнем графике показана вероятность нахождения остатка в одном из трех положений. Красным цветом показана вероятность нахождения остатка в мембране, розовым - внутри, синим - снаружи клетки. Отмечу, что алгоритм самостоятельно правильно определил, что мембранная часть белка состоит из α-спиралей.

Выше изображена выдача DeepTMHMM для β-цилиндрического белка порина F. Аналогично предыдущей картинке, Верхний график показывает наиболее вероятное для каждого из остатков положение: с внешней, внутренней стороны клетки или в мембране. На нижнем графике показана вероятность нахождения остатка в одном из трех положений. Красным цветом показана вероятность нахождения остатка во внешней мембране (в β-листе), зеленым - в периплазме (межмембранном пространстве), синим - снаружи клетки, светло-оранжевым - в сигнальном пептиде. Отмечу, что алгоритм самостоятельно правильно определил, что мембранная часть белка представлена структурой из β-листов.

Выдача в текстовом виде: пермеаза ThiP, порин F.

3. PPM: Предсказание положения выданного белка в мембране

Название α-спирального белка и его идентификатор в Uniprot были указаны в прошлом задании. Согласно UniProt, данный белок расположен во внутренней мембране бактерии. По графической выдаче DeepTMHMM для данного белка (см. задание 2) видим, что аминокислоты на N-конце с высокой вероятностью располагаются внутри клетки (т.е. N-конец находится в цитоплазме). Параметры запуска приведены в таблице ниже.

Таблица 2. Параметры запуска PPM для выданного белка
Число мембран1
Тип мембраныВнутренняя мембрана Грам-(-) бактерии
Allow curvatureНет
Топология (N-концевой домен)Внутри
Включить гетероатомы (для нестандартных аминокислотных остатков)Нет

Выдача PMM представлена в таблице ниже.

Таблица 3. Информация о пермеазе ThiP, вычисленная PPM
Толщина гидрофобной части белка в мембране29.9 ± 0.8 Å
ЛокализацияВнутренняя мембрана Грам-(-) бактерии
Координаты трансмембранных участков1(18-41), 2(58-84), 3(95-123), 4(146-165), 5(202-224), 6(250-271), 7(297-324), 8(335-360), 9(375-399),10(407-429),11(466-489),12(512-533)
Среднее количество остатков в одном β-тяже белка23 аминокислоты

4. Сравнение алгоритмов предсказания трансмембранных спиралей

Сравнение DeepTMHMM и PPM (α-спиральный белок ThiP) начнем с количества трансмембранных структур- в обоих случаях алгоритмы предсказали существование 12 α-спиральных трансмембранных элементов - это согласуется и с данными из UniProt.

В таблице ниже привожу позиции α-спиралей из DeepTMHMM, PPM и Uniprot.

Таблица 4. Координаты трансмембранных участков пермеазы ThiP
DeepTMHMMPPMUniProt
120-4118-4119-39
266-8758-8464-84
397-11895-123102-122
4147-167146-165142-162
5202-221202-224205-225
6251-271250-271250-270
7297-319297-324300-320
8339-363335-360343-363
9372-399375-399379-399
10408-428407-429406-426
11466-479466-489468-488
12512-534512-533510-530

В целом оба метода предсказывают координаты трансмембранных участков достаточно точно (близко к данным из UniProt, сложно сказать, какой из методов предсказания точнее).

Сравнение DeepTMHMM и OPM (порин F) начнем с количества трансмембранных структур - DeepTMHMM правильно предсказал наличие 8 бета-листов.

Таблица 4. Координаты трансмембранных участков пермеазы ThiP
DeepTMHMMOPM
130-385-14
252-6128-35
365-7243-48
493-10068-77
5109-11784-94
6137-145112-122
7152-159129-137
8175-182150-158

Как видно из таблицы выше, DeepTMHMM сместил бета-листы - 1, похоже, соответствует 2 в OPM, такая же ситуация наблюдается с 7 и 8. Я предполагаю, что в OPM представлена последовательность зрелого белка без сигнального пептида, а в DeepTMHMM была загружена последовательность с сигнальным пептидом - это объясняет смещение координат бета-листов.

На рисунке выше представлена структура, предсказанная AlphaFold. Достоверно предсказаны трансмембранные участки α-спиралей, с низкой точностью предсказана структура N-концевого домена. В целом качество предсказания - хорошее.

Поскольку трансмембранные участки предсказаны AlphaFold достоверно (pLDDT > 90), а низкое качество имеют участки, лежащие вне мембраны, я полагаю, что наличие участков с низким качеством предсказания структуры не повлияло на работу сервера PPM.

5. База данных TCDB

UniProt AC белка ThiP - Q2YLW7; UniProt AC порина F - P13794. Первый белок не был найден в базе данных TCDB. Второй белок внесен в эту базу данных. Выдача внесена в таблицу ниже.

Таблица 5. Параметры запуска PPM для выданного белка
TC-код1.B.6.1.2
Название белкаPORF aka OmpF aka OprF aka PA1777
Длина350 аминокислот
Молекулярная масса37640.00 Да
ВидPseudomonas aeruginosa
Число трансмембранных сегментов1
Локализация/ТопологияВнешняя мембрана клетки/Пронизывает мембрану несколько раз(multi-pass membrane protein)

Значение TC-кода выданного белка: 1. - каналы/поры; B. - β-цилиндрические порины; 6. - семейство OmpA-OmpF Porin (OOP); .1.2: индивидуальный код данного белка.