Практикум 6
- Сравнение предсказаний трансмембранных участков в бета-листовом белке
- PDB ID: 4RHB (комплекс LptDE)
- UniProt ID: LPTD_ECOLI
- Организм: E. coli
- Расположение: наружная мембрана клетки (OM, outer membrane)
- Сравнение предсказаний трансмембранных участков в альфа-спиральном белке
- Number of Membranes: оставила 1, так как белок маленький, и вроде как не прошивает сразу две мембраны насквозь
- Type of membrane: известно только то, что организм – грам-отрицательная бактерия, и в UniProt указана локализация в клеточной мембране, но неизвестно, в которой из двух, а они довольно сильно различаются по свойствам; поэтому, чтобы не угадывать, оставила значение undefined membrane
- Allow curvature: не думаю, что клеточная мембрана бактерий сильно волнистая, так что оставила no
- Topology (N-ter): так как DeepTMHMM предсказал для N-конца outside, поставила значение out, хотя бы даже для простоты сравнения
- Coordinate file: прикрепила файл с предсказанной AlphaFold структурой
- Include heteroatoms, excluding water and detergents, for positioning in membrane: гетероатомов в структуре, предсказанной AlphaFold, вроде быть не должно, какие каких-нибудь необычных аминокислот (тот же селеноцистеин было бы странно видеть в транспортере металлов)
- ■ – очень высокая степень уверенности (90 < pLDDT)
- ■ – высокая степень уверенности (70 < pLDDT < 90)
- ■ – низкая степень уверенности (50 < pLDDT < 70)
- ■ – очень низкая степень уверенности (pLDDT < 50)
Я выбрала белок LPS-assembly protein LptD E. coli. Общепринятого названия на русском мне обнаружить не удалось, но если вольно переводить, то это белок, собирающий липополисахарид (ЛПС).
ЛПС синтезируется в цитоплазме, после чего с помощью транспортоной системы (Lpt - от LPS transport), состоящей из семи белков: LptA, ..., LptG (см. рис. 1). Комплекс LptB2FG работает как ABC-транспортер и перемещает ЛПС из внутренней мембраны в периплазматическое пространство. LptC и LptA транспортируют ЛПС через периплазматическое пространство, а комплекс LptDE транслоцирует ЛПС через внешнюю мембрану на поверхность клетки (Xiaowei Dai et al.).
В OPM для белка указано 26 трансмембранных участков:
TM segments: 1( 244- 249), 2( 257- 262), 3( 270- 278), 4( 285- 292), 5( 311- 319), 6( 327- 333), 7( 356- 363), 8( 370- 377), 9( 390- 398), 10( 406- 415),11( 429-440),12( 447- 456),13( 481- 491),14( 506- 517),15( 555- 566),16( 575- 583),17( 607- 614),18( 622- 627), 19( 637- 645), 20( 653- 657), 21( 684- 692),22( 699- 704),23( 714- 721),24( 728- 735),25( 751- 757),26( 769- 778)
Последовательность, скачанную из UniProt, подала на вход DeepTMHMM, и получила следующее:
В основном, DeepTMHMM имеет довольно высокую степень увереннсти в предсказании.
Можно заметить, что просто по последовательности модель верно предсказала мембрану, в которой располагается белок. Обе модели предсказали по 26 трансмембранных участков, но, что интересно, это не совсем одни и те же (см. таблицу 1).
№ | Трансмембранные участки в OPM | Бета-листы, предсказанные DeepTMHMM |
---|---|---|
1 | – | 228-234 |
2 | 244-249 | 242-249 |
3 | 257-262 | 256-264 |
4 | 270-278 | 271-279 |
5 | 285-292 | 284-291 |
6 | 311-319 | 311-319 |
7 | 327-333 | 325-333 |
8 | 356-363 | 356-364 |
9 | 370-377 | 368-375 |
10 | 390-398 | 392-399 |
11 | 406-415 | 406-414 |
12 | 429-440 | 430-438 |
13 | 447-456 | 447-455 |
14 | 481-491 | 483-493 |
15 | 506-517 | 508-516 |
16 | 555-566 | 558-566 |
17 | 575-583 | 575-581 |
18 | 607-614 | 608-614 |
19 | 622-627 | 620-628 |
20 | 637-645 | 639-644 |
21 | 653-657 | 651-657 |
22 | 684-692 | 685-691 |
23 | 699-704 | 698-704 |
24 | 714-721 | 714-721 |
25 | 728-735 | 726-734 |
26 | 751-757 | 752-758 |
27 | 769-778 | – |
Из-за того, что в базе данных OPM нет первого трансмембранного участка, а DeepTMHMM не предсказала последний, получилось, что N- и C-концы располагаются в обоих случаях одинаково, а все участки между трансмембранными бета-листами обращены в разные стороны. Думаю, это стало возможно, потому что эти участки оказались не очень длинными, и их физические свойства не сильно повлияли на предсказание. Кроме того, границы трансмембранных участков из OPM не точно совпадают с предсказанными бета-листами, может быть потому, что это правда так, а может быть, например, в границы мембраны были установлены немного по-разному.
Вот так это всё выглядит:
Бирюзовая альфа-спираль действительно, судя по этой структуре, находится внутри мембраны, хотя её окружение и не состоит из липидов, при этом DeepTMHMM её не стал аннотировать как бета-лист. Первой части белка, как раз до первого бета-листа, предсказанного DeepTMHMM, вообще в структуре нет, и сам этот участок там бесструктурный.
Данный белок: Y1621_HAEIN
Название: Putative metal transport protein HI_1621 (предположительно, транспортер металлов)
Организм: Haemophilus influenzae (гемофильная палочка, палочка Пфайффера – грамотрицательная патогенная бактерия)
Про функцию известно, в целом, только то, что есть предположение, что он может быть вовлечён в транспорт металлов.
Сравним трансмембранные участки, которые указаны в UniProt с тем, что предскажет DeepTMHMM:
№ | Трансмембранные участки, указанные в UniProt | Трансмембранные альфа-спирали, предсказанные DeepTMHMM |
---|---|---|
1 | 6-26 | 12-26 |
2 | 38-58 | 40-52 |
3 | - | 63-73 |
4 | 72-92 | 77-92 |
5 | 94-114 | 102-117 |
6 | 136-156 | 136-153 |
7 | 165-185 | 170-189 |
DeepTMHMM предсказал на один трансмембранный участок больше.
Анализ белка с помощью PPM
Параметры PPM 3.0:
№ | Трансмембранные участки, указанные в UniProt | Трансмембранные альфа-спирали, предсказанные DeepTMHMM | Трансмембранные участки, предсказанные PPM |
---|---|---|---|
1 | 6-26 | 12-26 | 10-29 |
2 | 38-58 | 40-52 | 36-52 |
3 | - | 63-73 | 66-74 |
4 | 72-92 | 77-92 | 75-91 |
5 | 94-114 | 102-117 | 97-118 |
6 | 136-156 | 136-153 | 131-157 |
7 | 165-185 | 170-189 | 166-191 |
Последние два столбца достаточно сильно похожи, хотя границы трансмембранных участков оказались немного в разных местах.
PPM предсказал такое положение мембраны:
Судя по тому, что приведено на странице белка в UniProt, степень уверенности AlphaFold в предсказании достаточно высокая, за исключением неструктурированного участка на C-конце. Уверенность рассчитывается "понуклеотидно", и выражается в виде скора 0 ≤ pLDDT ≤ 100.
Можно сказать, что это неплохо согласуется с тем, что предсказанные двумя методами трансмембранные участки достаточно хорошо соотносятся друг с другом.