Практикум 6

  1. Сравнение предсказаний трансмембранных участков в бета-листовом белке
  2. Я выбрала белок LPS-assembly protein LptD E. coli. Общепринятого названия на русском мне обнаружить не удалось, но если вольно переводить, то это белок, собирающий липополисахарид (ЛПС).

    ЛПС синтезируется в цитоплазме, после чего с помощью транспортоной системы (Lpt - от LPS transport), состоящей из семи белков: LptA, ..., LptG (см. рис. 1). Комплекс LptB2FG работает как ABC-транспортер и перемещает ЛПС из внутренней мембраны в периплазматическое пространство. LptC и LptA транспортируют ЛПС через периплазматическое пространство, а комплекс LptDE транслоцирует ЛПС через внешнюю мембрану на поверхность клетки (Xiaowei Dai et al.).

    Рис. 1 Схема взаимодействия белков LptA, ..., LptG (Xiaowei Dai et al.)

    В OPM для белка указано 26 трансмембранных участков:

    TM segments: 1( 244- 249), 2( 257- 262), 3( 270- 278), 4( 285- 292), 5( 311- 319), 6( 327- 333), 7( 356- 363), 8( 370- 377), 9( 390- 398), 10( 406- 415),11( 429-440),12( 447- 456),13( 481- 491),14( 506- 517),15( 555- 566),16( 575- 583),17( 607- 614),18( 622- 627), 19( 637- 645), 20( 653- 657), 21( 684- 692),22( 699- 704),23( 714- 721),24( 728- 735),25( 751- 757),26( 769- 778)

    Последовательность, скачанную из UniProt, подала на вход DeepTMHMM, и получила следующее:

    Рис. 2 График из выдачи DeepTMHMM. На верхней части схематически нарисовано, как белок располагается относительно мембраны, а на нижней - вероятность того, что данный участок последовательности находится в бета-листе, располагается в периплазме, либо снаружи клетки, или является частью сигнального участка, который обусловливает транспорт белка в нужную мембрану.

    В основном, DeepTMHMM имеет довольно высокую степень увереннсти в предсказании.

    Можно заметить, что просто по последовательности модель верно предсказала мембрану, в которой располагается белок. Обе модели предсказали по 26 трансмембранных участков, но, что интересно, это не совсем одни и те же (см. таблицу 1).

    Таблица 1 Сравнение результатов, полученных из OPM и при помощи DeepTMHMM
    Трансмембранные участки в OPM Бета-листы, предсказанные DeepTMHMM
    1 228-234
    2 244-249 242-249
    3 257-262 256-264
    4 270-278 271-279
    5 285-292 284-291
    6 311-319 311-319
    7 327-333 325-333
    8 356-363 356-364
    9 370-377 368-375
    10 390-398 392-399
    11 406-415 406-414
    12 429-440 430-438
    13 447-456 447-455
    14 481-491 483-493
    15 506-517 508-516
    16 555-566 558-566
    17 575-583 575-581
    18 607-614 608-614
    19 622-627 620-628
    20 637-645 639-644
    21 653-657 651-657
    22 684-692 685-691
    23 699-704 698-704
    24 714-721 714-721
    25 728-735 726-734
    26 751-757 752-758
    27 769-778

    Из-за того, что в базе данных OPM нет первого трансмембранного участка, а DeepTMHMM не предсказала последний, получилось, что N- и C-концы располагаются в обоих случаях одинаково, а все участки между трансмембранными бета-листами обращены в разные стороны. Думаю, это стало возможно, потому что эти участки оказались не очень длинными, и их физические свойства не сильно повлияли на предсказание. Кроме того, границы трансмембранных участков из OPM не точно совпадают с предсказанными бета-листами, может быть потому, что это правда так, а может быть, например, в границы мембраны были установлены немного по-разному.

    Вот так это всё выглядит:

    Рис. 3 Модель, скачанная из OPM (PDB ID: 4RHB), отмечены учатки, которые аннотированы в OPM как трансмембранные и то, что DeepTMHMM предсказал как бета-листы, а также их пересечение. Также показаны внеклеточная сторона и сторона мембраны, обращённая в периплазму и ион Na+. Всё остальное серое, а именно оставшаяся часть белка LptD и белок LptE (внутри LptD).

    Бирюзовая альфа-спираль действительно, судя по этой структуре, находится внутри мембраны, хотя её окружение и не состоит из липидов, при этом DeepTMHMM её не стал аннотировать как бета-лист. Первой части белка, как раз до первого бета-листа, предсказанного DeepTMHMM, вообще в структуре нет, и сам этот участок там бесструктурный.

  3. Сравнение предсказаний трансмембранных участков в альфа-спиральном белке
  4. Данный белок: Y1621_HAEIN
    Название: Putative metal transport protein HI_1621 (предположительно, транспортер металлов)
    Организм: Haemophilus influenzae (гемофильная палочка, палочка Пфайффера – грамотрицательная патогенная бактерия)

    Про функцию известно, в целом, только то, что есть предположение, что он может быть вовлечён в транспорт металлов.

    Сравним трансмембранные участки, которые указаны в UniProt с тем, что предскажет DeepTMHMM:

    Рис. 4 График из выдачи DeepTMHMM.
    Таблица 2 Сравнение результатов, полученных из UniProt и при помощи DeepTMHMM
    Трансмембранные участки, указанные в UniProt Трансмембранные альфа-спирали, предсказанные DeepTMHMM
    1 6-26 12-26
    2 38-58 40-52
    3 - 63-73
    4 72-92 77-92
    5 94-114 102-117
    6 136-156 136-153
    7 165-185 170-189

    DeepTMHMM предсказал на один трансмембранный участок больше.

    Анализ белка с помощью PPM

    Параметры PPM 3.0:

    Таблица 3 Сравнение результатов, полученных из UniProt, при помощи DeepTMHMM и PPM по структуре, предсказанной AlphaFold.
    Трансмембранные участки, указанные в UniProt Трансмембранные альфа-спирали, предсказанные DeepTMHMM Трансмембранные участки, предсказанные PPM
    1 6-26 12-26 10-29
    2 38-58 40-52 36-52
    3 - 63-73 66-74
    4 72-92 77-92 75-91
    5 94-114 102-117 97-118
    6 136-156 136-153 131-157
    7 165-185 170-189 166-191

    Последние два столбца достаточно сильно похожи, хотя границы трансмембранных участков оказались немного в разных местах.

    PPM предсказал такое положение мембраны:

    Рис. 5 Выдача PPM. Белок покрашен в спектр от N-конца к С-концу. Небольшая альфа-спираль, показанная стрелкой – та спираль, которая не была указана в UniProt.

    Судя по тому, что приведено на странице белка в UniProt, степень уверенности AlphaFold в предсказании достаточно высокая, за исключением неструктурированного участка на C-конце. Уверенность рассчитывается "понуклеотидно", и выражается в виде скора 0 ≤ pLDDT ≤ 100.

    • – очень высокая степень уверенности (90 < pLDDT)
    • – высокая степень уверенности (70 < pLDDT < 90)
    • – низкая степень уверенности (50 < pLDDT < 70)
    • – очень низкая степень уверенности (pLDDT < 50)
    Рис. 6 Степень уверенности AlphaFold в предсказании третичной структуры.

    Можно сказать, что это неплохо согласуется с тем, что предсказанные двумя методами трансмембранные участки достаточно хорошо соотносятся друг с другом.