1. В качестве белка я выбрал белок W внешней мембраны (outer membrane protein W), который выступает в качестве рецептора колицина - бактериального токсина, выделяемого E. coli, к которому восприимчива часть её же штаммов. Идентификатор PDB: 2F1V. Идентификатор UniProt: OMPW_ECOLI.
Трансмембранные участки белка по OPM: 1(5-14), 2(37-46), 3(51-59), 4(79-89), 5(96-106), 6(132-143), 7(148-157), 8(181-191)
Последовательность белка была взята из UniProt. DeepTMHMM по данной последовательности предсказал такие трансмембранные участки: (27-39), (56-68), (72-83), (99-109), (118-129), (151-163), (169-180), (199-211). Ссылка на файловую выдачу: файл
При сравнении работы двух программ видно, что оба нашли одинаковое количество трансмембранных участков, однако большая часть из них не перекрывается или мало перекрывается. Только OPM выдала, что есть участки (5-14), (132-143), (181-191). Только DeepTMHMM выдала участки (118-129), (169-180), (199-211). Вероятно, предсказания различаются из-за того, что в базе SwissProt белковая запись содержит сигнальный пептид, в отличие от записи в OPM, где этот пептид не включен в состав.
Для задания мне был выдан белок OppC транспортной системы олигопептидов (oligopeptide transport system permease protein OppC) из E.coli, который выступает в качестве части транспортной системы, ответственной за перенос олигопептидов через мембраны. Идентификатор: OPPC_ECO57
DeepTMHMM предсказал наличие таких трансмембранных участков: (38-56), (105-127), (136-159), (164-180), (219-236), (270-290). Ссылка на файловую выдачу: файл
Для алгоритма PPM 3.0 были даны следующие параметры: number of membranes[1]
type of membrane[gram-negative bacteria inner membrane, так как в описании белка говорится о том, что он нахоится на внутренней мембране E. coli, которая является грам-отрицательной]
allow curvature[yes]
topology (n-ter)[in, так как конец белка расположен внутри, что мы можем увидеть в рис. 2]
Include heteroatoms, excluding water and detergents, for positioning in membrane[no]
По итогу работы алгоритм выдал такие результаты, которые, я бы сказал, совпадают со сведениями из DeepTMHMM, за исключением небольших различий. В таблице ниже дано сравнение вывода двух алгоритмов
Номер спирали | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
DeepTMHMM | 38-56 | 105-127 | 136-159 | 164-180 | 219-236 | 270-290 |
PPM 3.0 | 38-59 | 93-123 | 136-160 | 164-181 | 225-243 | 269-290 |
Ссылка на выдачу алгоритма в формате pdb: ссылка.
Отсюда я могу сделать вывод о том, что алгоритмы намного лучше предсказывают такие трансмембранные участки, которые состоят из альфа-спиралей. Возможно это связано с тем, что альфа-спиральных трансмембранных белков просто на порядок больше, чем бета-листовых, и из-за этого натренированность алгоритмов выше.