Трансмембранные белки

Задание 1. Знакомство с базой данных OPM

Для выполнения этого задания из базы данных OPM был выбран мальтопорин, принадлежащий Escherichia coli. Данный тримерный трансмембранный белок относится к классу белков, имеющих структуру β-бочонка (Рис.1) и участвует в транспорте мальтозы и мальтодекстринов. Также известно, что он может играть роль рецептора для некоторых бактериофагов, в том числе и для λ.

Мальтопорин Escherichia coli локализован во внешней мембране. Согласно информации из баз данных, в толщину гидрофобная часть белка составляет 25.1 Å, что подтверждается измерением растояния с помощью инструмента Measure distance в программе Pymol.(Рис.1)

Рис.1. Расположение мальтопорина Escherichia coli в мембране.
ХарактеристикаДанные
Тип белкаТрансмембранный белок, бета-бочонок
СуперсемействоПорины, транспортрующие сахара
СемейсвоМальтопорин-подобные белки
ОрганизмEscherichia coli
ЛокализацияВнешняя мембрана Грам-отрицательной бактерии
Uniprot IDLAMB_ECOLI
PDB1AF6
Толщина гидрофобного слоя25.1 Å
Число трансмембранных структур54 (в тримере)
Средняя длина трансмембранных структур9-11
ТопологияN-конец белка в периплазме

Согласно базе данных, белок имеет 18 гидрофобных участков длиной примерно 9-12 остатков: 1(2-13),2(39-48),3(58-68),4(75-88),5(98-103),6(125-132),7(138-146),8(170-179),9(185-194),10(213-221),11(227-235),12(269-278),13(284-293),14(305-314),15(320-329),16(343-352),17(361-370),18(411-420).

Задание 2. DeepTMHMM: Предсказание трансмембранных элементов по последовательности белка

Рис.2. Предсказание трансмембранных элементов для LAMB_ECOLI. На нижней схеме представленны вероятности пренадлежности аминокислотного остатка к одной из групп: сигнал локализации на внешней мембране (оранжевый), β-листовой трансмембранный участок (красный), локализация во внешней среде (синий), локализация в периплазме (зеленый).
Рис.3. Предсказание трансмембранных элементов для KUP1_BIFLO.На нижней схеме представленны вероятности пренадлежности аминокислотного остатка к одной из групп: трансмембранная α-спираль (красный), локализация во внешней среде (синий), локализация в периплазме (розовый).

Предсказания трансмембранных элементов с помощью DeepTMHMM проводились для α-спирального белка KUP1_BIFLO и β-листового LAMB_ECOLI. На вход алгоритму были поданы соответсвующие fasta-файлы KUP1_BIFLO и LAMB_ECOLI, на выходе были получены следующие файлы: KUP1_BIFLO и LAMB_ECOLI. Для LAMB_ECOLI было предсказано 18 трансмембранных участков протяженностью от 7 до 12 а.о., что соответсвует информации из OPM, координаты этих участков не совпадают с указанныим в базе данных. Это можно объяснить тем, что информация о трансмембранных участках в OPM была получена с помощью структуры белка из PDB, которой не хватает N-концевого участка длиной 25 а.о., из-за чего предсказанные по fasta-файлу из UniProt участки сдвинулись относительно участков и OPM примерно на 25-24 позиции. Если сравнить предсказание с аннотацией трансмембранных участков из UniProt, можно сделать вывод, что DeepTMHMM довольно точно может предсказать их положение, однако длины этих участков могут слегка не соотвествовать достоверным значениям. N- и C-концы этого белка, согласно предсказанию, погружены в периплазму. Для KUP1_BIFLO было предсказано 10 трансмембранных участков протяженностью от 16 до 26 а.о. Если сравнивать с информацией об этом белке, доступной в UniProt, то можно заметить, что DeepTMHMM смог предсказать правильное количество и примерное положение трансмембранных участков, однако их точные границы и длины не совпадают. N- и C-концы этого белка, согласно предсказанию, погружены во внутрь клетки.

Задание 3. PPM: Предсказание положения выданного белка в мембране

В качестве объекта для следующего задания был взят белок KUP1_BIFLO, предположительно выполняющий функции калиевого канала в Bifidobacterium longum. Для него пока не была получена достоверная структура, однако существует предсказанная с помощью программы AlphaFold (Рис.4). Модель для большинства аминокислотных остатков уверена в их пространственном расположении (для них pLDDT > 70, что на Рис.4 обозначено голубым и синим цветами), уверенность падает лишь на концевых участках без определенной вторичной структуры. Поэтому на основе данной структуры было получено предсказание расположения данного белка в мембране с помощью программы PPM, которая принимает на вход pdb-файл и набор параметров. Для данного белка были выбраны следующие параметры:

Рис.4. Предсказанное расположение KUP1_BIFLO в мембране Bifidobacterium longum и уверенность AlphaFold в предсказании.

В результате работы программы было получено следующее предсказание:

ХарактеристикаДанные
Тип белкаТрансмембранный альфа-спиральный
НазваниеПредполагаемый калиевый канал
ОрганизмBifidobacterium longum
ЛокализацияМембрана Грам-положительной бактерии
Uniprot IDKUP1_BIFLO
PDBПредсказание PPM
Толщина гидрофобного слоя28.9 ± 1.0 Å
Число трансмембранных структур10
Длина трансмембранных структур20-30
Предсказанные трансмембранные участки: 1(28-57), 2(69-88), 3(95-116), 4(146-165), 5(172-192), 6(221-245), 7(278-297), 8(298-320), 9(328-355), 10(356-372).

Задание 4. Сравнение алгоритмов предсказания трансмембранных спиралей

Предсказания для LAMB_ECOLI:

DeepTMHMM
Предсказанные трансмембранные участки (с вычетом участка в 25 а.о. вначале белка):
1(3-12), 2(39-47), 3(59-67), 4(79-88), 5(99-105), 6(124-132), 7(138-145), 8(171-177), 9(186-193), 10(214-221), 11(227-234), 12(270-278), 13(285-292), 14(307-314), 15(321-327), 16(344-352), 17(357-368), 18(413-420)
OPM
Трансмембранные участки:
1(2-13), 2(39-48), 3(58-68), 4(75-88), 5(98-103), 6(125-132), 7(138-146), 8(170-179), 9(185-194), 10(213-221), 11(227-235), 12(269-278), 13(284-293), 14(305-314), 15(320-329), 16(343-352), 17(361-370), 18(411-420)

Из сопоставления видно, что DeepTMHMM смог найти все 18 трансмембранных участков в нужных местах, хотя и с небольшими расхождениями в 1-4 остатка.

Предсказания для KUP1_BIFLO:

DeepTMHMM
Предсказанные трансмембранные участки:
1(28-49), 2(72-88), 3(98-119), 4(145-163), 5(178-195), 6(226-246), 7(277-293), 8(300-320), 9(329-354), 10(357-372)
OPM
Предсказанные трансмембранные участки:
1(28-57), 2(69-88), 3(95-116), 4(146-165), 5(172-192), 6(221-245), 7(278-297), 8(298-320), 9(328-355), 10(356-372)

В данном случае заметим, что DeepTMHMM также смог найти все 10 трансмембранных участков в примерно нужных местах, хотя и с довольно большими расхождениями в 1-8 остатка.

Задание 5. База данных TCDB

KUP1_BIFLO: отсутсвует в TCBD. В UniProt я нашел его AC и ввел в поле поиска TCDB его. В строку поиска TCBD я вводил

LAMB_ECOLI: в базе данных имеется запись.
В данной записи указано довольно мало информация о самом белке (длина последовательности, молярная массе, принадлежность организму, топология белка, субстрат). Помимо этого на странице есть множество ссылок на другие базы данных. В TCBD по некоторой причине для данного белка указан только один трансмембранный участок, который не соответсвует аннотации OPM или DeepTMHMM.

TC код для LAMB_ECOLI - 1.B.3.1.1, где