УЧЕБНЫЙ САЙТ
Буяновой Мишель
ФАКУЛЬТЕТ БИОИНЖЕНЕРИИ
И БИОИНФОРМАТИКИ МГУ им. М.В. ЛОМОНОСОВА
Семестр IV Семестр III Семестр II Cеместр I

Мембранные белки

База данных OPM

В базе данных OPM (Orientation of Proteins in Membranes) был проведен поиск по выданному идентификатору 4ryi, трансмембранная часть которого состояла из α-спиралей. Для рассмотрения белка с β-тяжевой трансмембранной составляющей был выбран белок 4rdt.

Основная информация об этих белках приведена в Таблице 1. Трансмембранные участки были получены в разделе Transmembrane subunits на странице каждого из белков. С помощью небольшого скрипта на Python вычисление среднего количества остатков в участке было автоматизировано (строка Segments из OPM задается в качестве переменной).

Таблица 1. Рассматриваемые трансмембранные белки из OPM


PDB IDКласс мембранного белка из OPMТрансмембранные участки Среднее число остатков в трансмембранных участках
4ryi_bполитопные* трансмембранные белки из α-спиралей 1( 8- 25), 2( 44- 65), 3( 74- 96), 4( 102- 123), 5( 127- 146) 8
4rdtтрансмембранные белки с β-бочонками 1( 148- 156), 2( 163- 171), 3( 177- 185), 4( 211- 219), 5( 224- 230), 6( 310- 318), 7( 324- 332), 8( 356- 363), 9( 369- 377), 10( 406- 415), 11( 418- 426), 12( 462- 470), 13( 477- 482), 14( 519- 526), 15( 533- 539), 16( 580- 588), 17( 595- 600), 18( 639- 647), 19( 654- 659), 20( 679- 688), 21( 694- 701), 22( 725- 732) 21

*Политопность белков подразумевает многократное пересечение мембраны, то есть наличие нескольких трансмембранных участков.

Структуры предсказаний OPM были скачаны и визуализированы при помощи средств Pymol. На Рис.1 и Рис.2 представлены, помимо структур, и краткие характеристики белков: название, тип, класс, а также — толщина мембранной гидрофобной части. Приведены обозначения p- и n-сторон мембраны. Указано и расположение белков: 4ryi встроен в плазматическую мембрану грам-положительных бактерий, а 4rdt — во внешнюю мембрану грам-отрицательных.

Рис. 1. Трансмембранный α-спиральный белок 4ryi


Рис. 2. Трансмембранный β-тяжевой белок 4rdt

Согласно базе данных OPM, 4ryi является мембранным транслокатором, и, соответственно, находится он в плазматической мембране, в то время как 4rdt являет собой транспортер ионов цинка, располагающийся на внешней мембране отрицательных бактерий.

Интересно отметить, что этот белок, также называемый ZnuD (zinc-uptake component D), консервативен и встречается у группы бактерий, вызывающих бактериальный менингит (Neisseria meningitidis и др.). Находясь в организме инфицированного хозяина, они оказываются в условиях дефицита цинка, необходимого для протекания различных процессов в клетке и входящего в состав множества белков. Борьба же с хозяином за этот ценный ресурс ведется при помощи высокоспецифичных транспортеров, имеющих большое сродство к этому иону, и важнейшим из них является[1] ZnuD (4rdt).

Анализ предсказания трансмембранных спиралей

Дальнейшая работа проводилась с цепью B трансмембранного белка спиральной структуры 4ryi (RCSB PDB entry). Сервисы предсказания TMHMM и Phobius принимают на вход вторичную последовательность белка. Поэтому с PDB была скачана [fasta]-последовательность 4ryi (в ней оставлена лишь последовательность нужной цепи B).

Однако при тестировании предсказаний двух указанных сервисов были обнаружены несовпадающие с OPM результаты, которые было решено проверить вручную в Pymol. Обнаружилось, что предсказанные участки полностью отсутствуют в структуре. То есть количество остатков в [fasta]-файле (181), подававшемся на вход программам предсказания, превышает число остатков в [pdb]-структуре (151).

Решение проблемы содержалось в ремарках [pdb]-файла (см. выдержку), в которых были перечислены нераспознанные при разрешении структуры 30 аминоксилотных остатков. Они и были затем удалены мной из последовательности, что привело к получению соответствующего [pdb]-структуре [fasta]-файла. Анализировать изначальные предсказания, по моему мнению, было бы неправомерно: БД OPM нами принимается за эталон, а в ней пространственная структура в точности сооответствует структуре из PDB с потерянными атомами.

Итак, при работе с уже обновленной последовательностью сервисы показали неплохие результаты, явно коррелирующие с положением дел, описанным в OPM.)

Рис. 3. Предсказание TMHMM


На графике выдачи отображена апостериорная вероятность нахождения снаружи, внутри или же в трансмембранном участке. На нем показываются также и маловероятные трансмембранные спирали, что дает представление о точности каждого участка предсказания.

В верхней части графика (1-1.2) располагается наилучшее предсказание алгоритма. Обозначения цветов приведены на рисунке: они отображают наиболее вероятное расположение определенных аминокислотных остатков относительно мембраны.

Текстовая запись предсказания, помимо координат участков содержит также и некую дополнительную информацию, такую как:

  • length: длина последовательности
  • number of predicted TMHs: количество найденных трансмембранных (ТМ-) спиралей
  • Exp number of AAs in TMHs: ождаемое число аминокислот в ТМ-спиралях (>=18 говорит о том, что с высокой долей вероятности это либо ТМ-белок, либо сигнальный пептид)
  • Exp number, first 60 AAs: то же, но в числе первых 60 аминокислот (значения, отклоняющиеся от малых (~10), говорят о высокой вероятности наличия сигнального пептида на N-конце)
  • Total prob of N-in: вероятность нахождения N-конца белка с внутренней стороны мембраны
  • POSSIBLE N-term signal sequence: сообщение о вероятном наличии сигнального пептида.

Рис. 4. Предсказание Phobius


График выдачи Phobius также является графиком апостериорной вероятности с тем отличием, что здесь, помимо прочего, отдельно расчитывается вероятность нахождения остатка в сигнальном пептиде.

Стоит также рассмотреть краткий вариант выдачи:

SEQENCE ID                     TM SP PREDICTION
4RYI:B|PDBID|CHAIN|SEQUENCE     5  0 i7-25o45-67i74-93o99-118i125-148o
  • TM: число предсказанных ТМ-участков
  • SP: индикатор предсказания сигнального пептида (в нашем случае — 'нет')

Само же предсказание записывается в виде строки, в которой ТМ-участки указаны как пара 'начало-конец', а внешние и внутренние участки разделяют их и обозначаются как o, i.

Предсказания как одного, так и другого сервиса хорошо согласуются между собой и с данными OPM.

База данных TCBD

TCBD, или Transporter Classification Database, содержит данные по белкам мембранного транспорта и разработке их классификации.

В ней был найден только белок 4rdt, которому присвоен TCID 1.B.14.2.9.

Компоненты TCID, разделенные точками, указывают на класс, подкласс, семейство, подсемейство и собственно транспортер.

  • 1: Каналы/Поры
  • 1.B: Бета-бочонковые порины
  • 1.B.14 OMR (Рецепторы внешней мембраны)

Далее официальная классификация не дает названия подсемейству, но, очевидно, из всего OMR-семейства белки 1.B.14.2.X активнее всех вовлечены во взаимодействие с гемом, гемоглобином, трансферрином.


[1] PubMed Article