Анализ трансмембранного белка

Из каталога OPM был выбран белок TOLC_ECOLI, являющийся эффлюксной помпой и фактором устойчивости к ампициллину для Escherichia coli. Именно этот белок был выбран из-за того что в процессе выполнения курсовой работы в лаборатории мне довелось работать со штаммом Escherichia coli_TOLC, который имел устойчивость к ампициллину именно благодоря этому белку.

Для работы были получены последовательность в Fasta формате и PDB файл 1ek9 с трехмерной структурой.

Толщина внутримембранной части белка: 2.46 nm (2.25 nm по моим измерениям в Jmol)

Трансмембранные участки: 1(40-50),2(65-77),3(246-256),4(282-290)

Трансмембранные участки(по DeepTHMHMM): ( 64 - 72 ) ( 89 - 94 ) ( 270 - 278 ) ( 305 - 310 )

Длины участков совпадают с небольшой погрешностью, однако можно заметить "смещение" на 24 аминокислоты - это след сигнального белка локализации, который читается и распознается DeepTHMHMM, однако не входит в OPM, так как отсутствует в конечной структуре белка.

Uniprot ID: P02930

Количество остатков в B-тяже: от 11 до 16

Из трехмерной структуры можем видеть, что белок имеет структуру, состоящую из 2 частей - внутриклеточной, собранной преимущественно из A-спиралей и внутримембранной, представляющей из себя B-бочонок 2.46 nm длины и 3.1 nm в поперечном сечении. Белок располагается на мембране, разграничивающей внешнюю среду и периплазму грамм-отрицательной Escherichia coli.

DeepTMHMM

Графическая выдача DeepTMHMM состоит из двух графиков: на верхем по горизонтали отложены номера аминокислот белка, а в плоскости графика обозначено их расположение относительно мембраны. Нижний график является расширенной версией первого - на нем помимо расположения участков белка по вертикальной шкале отложена вероятность этого расположения, посчитанная машиной.

Белок с B-листами

В графической выдаче к белку TOLC_ECOLI можно видеть, что алгоритм предсказал 4 участка последовательности располагающимися внутри мембраны - отмечены красным. Участки белка, находящиеся вне мембраны определены к внешней среде (синий) и периплазме (зеленый). Также на графике можно увидеть желтую линию Signal - расположение белка-маркера для периплазматической локализации.

Текстовая выдача

Белок с А-спиралями

Для выданного мне белка LMRB_BACSU (эффлюксная помпа и фактор устойчивости к линкомицину для Bacillus subtilis) алгоритм определил 14 внутримембранных участков. Относительно расположения в клетке, программа предсказала локализацию в мембране, разделяющей цитозоль клетки (отмеченно розовым) и внешнюю среду.

Текстовая выдача

PPM

Алгоритм был запущен с параметрами:

Type of membrane: Gram-positive bacteria inner membrane (Bacillus subtilis является грамм-положительной бактерией)

Topology (N-ter): In (по предсказанию DeepTMHMM оба конца белка находятся внутри мембраны)

Allow curvature: Yes (для более интересных результатов)

Include heteroatoms: No (по данным UniProt лигандов в структуре белка нет)

Результаты:

Depth/Hydrophobic Thickness: 31.3 ± 0.7 Å

ΔGtransfer: -115.9 kcal/mol

Tilt Angle: 11 ± 0°

Трансмембранные участки: 1( 18- 40), 2( 55- 76), 3( 81- 101), 4( 107- 128), 5( 142- 164), 6( 170- 190), 7( 205- 227), 8( 235- 258), 9( 273- 295),10( 307- 328),11( 339- 357),12( 362- 386),13( 398- 423),14( 450- 471)

Трансмембранные участки (DeepTMHHM): ( 20 - 40 ) ( 56 - 76 ) ( 85 - 102 ) ( 105 - 127 ) ( 147 - 156 ) ( 172 - 190 ) ( 205 - 222 ) ( 237 - 253 ) ( 273 - 295 ) ( 311 - 331 ) ( 338 - 354 ) ( 363 - 383 ) ( 402 - 422 ) ( 453 - 471 )

Наблюдается небольшое (1-2 аминокислоты) отклонение в длинах участков, однако количество и расположение предсказанных трансмембранных участков совпадают с таковым у DeepTMHMM, что свидетельствует о правильной работе алгоритма.

Для выданного мне белка трехмерная структура предсказана крайне точно при помощи AlphaFold - почти все участки белка имеют уверенность алгоритма более 85 (белок почти полностью синий). Таким образом, проследить какую-либо закономерность между качеством предсказания участка AlphaFold и его обработкой PPM на примере моего белка не представляется возможным.

TCDB

База данных TCDB предоставляет достаточно большое количество разнообразных данных о функции белка, а также агрегирует ссылки на сторонние БД, полезные при работе с трансмембранными белками. Мы остановимся на ТС идентификаторе белка - индивидуальном номере, присваивающемся трансмембранным белкам по аналогии с ЕС для энзимов.

Идентификатор белка TOLC_ECOLI:

1.B.17.1.1

1. Принадлежность белка к порам или каналам

B. Наличие в трансмембранной структуре В-бочонка

17. Принадлежность к группе внешнемембранных факторов (OMF)

1.1 Индивидуальный номер белка