Для выполнения этого задания из базы данных OPM был выбран мальтопорин, принадлежащий Escherichia coli. Данный тримерный трансмембранный белок относится к классу белков, имеющих структуру β-бочонка (Рис.1) и участвует в транспорте мальтозы и мальтодекстринов. Также известно, что он может играть роль рецептора для некоторых бактериофагов, в том числе и для λ.
Мальтопорин Escherichia coli локализован во внешней мембране. Согласно информации из баз данных, в толщину гидрофобная часть белка составляет 25.1 Å, что подтверждается измерением растояния с помощью инструмента Measure distance в программе Pymol.(Рис.1)
Характеристика | Данные |
---|---|
Тип белка | Трансмембранный белок, бета-бочонок |
Суперсемейство | Порины, транспортрующие сахара |
Семейсво | Мальтопорин-подобные белки |
Организм | Escherichia coli |
Локализация | Внешняя мембрана Грам-отрицательной бактерии |
Uniprot ID | LAMB_ECOLI |
PDB | 1AF6 |
Толщина гидрофобного слоя | 25.1 Å |
Число трансмембранных структур | 54 (в тримере) |
Средняя длина трансмембранных структур | 9-11 |
Топология | N-конец белка в периплазме |
Согласно базе данных, белок имеет 18 гидрофобных участков длиной примерно 9-12 остатков: 1(2-13),2(39-48),3(58-68),4(75-88),5(98-103),6(125-132),7(138-146),8(170-179),9(185-194),10(213-221),11(227-235),12(269-278),13(284-293),14(305-314),15(320-329),16(343-352),17(361-370),18(411-420).
Предсказания трансмембранных элементов с помощью DeepTMHMM проводились для α-спирального белка KUP1_BIFLO и β-листового LAMB_ECOLI. На вход алгоритму были поданы соответсвующие fasta-файлы KUP1_BIFLO и LAMB_ECOLI, на выходе были получены следующие файлы: KUP1_BIFLO и LAMB_ECOLI. Для LAMB_ECOLI было предсказано 18 трансмембранных участков протяженностью от 7 до 12 а.о., что соответсвует информации из OPM, координаты этих участков не совпадают с указанныим в базе данных. Это можно объяснить тем, что информация о трансмембранных участках в OPM была получена с помощью структуры белка из PDB, которой не хватает N-концевого участка длиной 25 а.о., из-за чего предсказанные по fasta-файлу из UniProt участки сдвинулись относительно участков и OPM примерно на 25-24 позиции. Если сравнить предсказание с аннотацией трансмембранных участков из UniProt, можно сделать вывод, что DeepTMHMM довольно точно может предсказать их положение, однако длины этих участков могут слегка не соотвествовать достоверным значениям. N- и C-концы этого белка, согласно предсказанию, погружены в периплазму. Для KUP1_BIFLO было предсказано 10 трансмембранных участков протяженностью от 16 до 26 а.о. Если сравнивать с информацией об этом белке, доступной в UniProt, то можно заметить, что DeepTMHMM смог предсказать правильное количество и примерное положение трансмембранных участков, однако их точные границы и длины не совпадают. N- и C-концы этого белка, согласно предсказанию, погружены во внутрь клетки.
В качестве объекта для следующего задания был взят белок KUP1_BIFLO, предположительно выполняющий функции калиевого канала в Bifidobacterium longum. Для него пока не была получена достоверная структура, однако существует предсказанная с помощью программы AlphaFold (Рис.4). Модель для большинства аминокислотных остатков уверена в их пространственном расположении (для них pLDDT > 70, что на Рис.4 обозначено голубым и синим цветами), уверенность падает лишь на концевых участках без определенной вторичной структуры. Поэтому на основе данной структуры было получено предсказание расположения данного белка в мембране с помощью программы PPM, которая принимает на вход pdb-файл и набор параметров. Для данного белка были выбраны следующие параметры:
В результате работы программы было получено следующее предсказание:
Характеристика | Данные |
---|---|
Тип белка | Трансмембранный альфа-спиральный |
Название | Предполагаемый калиевый канал |
Организм | Bifidobacterium longum |
Локализация | Мембрана Грам-положительной бактерии |
Uniprot ID | KUP1_BIFLO |
PDB | Предсказание PPM |
Толщина гидрофобного слоя | 28.9 ± 1.0 Å |
Число трансмембранных структур | 10 |
Длина трансмембранных структур | 20-30 |
Предсказания для LAMB_ECOLI:
DeepTMHMM
Предсказанные трансмембранные участки (с вычетом участка в 25 а.о. вначале белка):
1(3-12), 2(39-47), 3(59-67), 4(79-88), 5(99-105), 6(124-132), 7(138-145), 8(171-177), 9(186-193), 10(214-221), 11(227-234), 12(270-278), 13(285-292), 14(307-314), 15(321-327), 16(344-352), 17(357-368), 18(413-420)
OPM
Трансмембранные участки:
1(2-13), 2(39-48), 3(58-68), 4(75-88), 5(98-103), 6(125-132), 7(138-146), 8(170-179), 9(185-194), 10(213-221), 11(227-235), 12(269-278), 13(284-293), 14(305-314), 15(320-329), 16(343-352), 17(361-370), 18(411-420)
Из сопоставления видно, что DeepTMHMM смог найти все 18 трансмембранных участков в нужных местах, хотя и с небольшими расхождениями в 1-4 остатка.
Предсказания для KUP1_BIFLO:
DeepTMHMM
Предсказанные трансмембранные участки:
1(28-49), 2(72-88), 3(98-119), 4(145-163), 5(178-195), 6(226-246), 7(277-293), 8(300-320), 9(329-354), 10(357-372)
OPM
Предсказанные трансмембранные участки:
1(28-57), 2(69-88), 3(95-116), 4(146-165), 5(172-192), 6(221-245), 7(278-297), 8(298-320), 9(328-355), 10(356-372)
В данном случае заметим, что DeepTMHMM также смог найти все 10 трансмембранных участков в примерно нужных местах, хотя и с довольно большими расхождениями в 1-8 остатка.
KUP1_BIFLO: отсутсвует в TCBD. В UniProt я нашел его AC и ввел в поле поиска TCDB его. В строку поиска TCBD я вводил
LAMB_ECOLI: в базе данных имеется запись.
В данной записи указано довольно мало информация о самом белке (длина последовательности, молярная массе, принадлежность организму, топология белка, субстрат).
Помимо этого на странице есть множество ссылок на другие базы данных. В TCBD по некоторой причине для данного белка указан только один трансмембранный участок, который не соответсвует аннотации OPM или DeepTMHMM.
TC код для LAMB_ECOLI - 1.B.3.1.1, где