Учебный сайт студента ФББ МГУ

Киселёв Матвей Олегович

Отчёт о практикуме 3

Задание 1. Сравнение предсказаний трансмембранных участков в бета-листовом белке

Цель задания: сравнить результаты предсказаний трансмембранных участков по последовательности (с помощью DeepTMHMM) и по трехмерной структуре (база данных OPM) в β-листовом белке.

Объект исследования: порин OprO (porin OprO, Uniprot ID: P32977, PDB ID: 4RJW) грам-отрицательной бактерии Pseudomonas aeruginosa. Далее для краткости я буду использовать сокращение 4RJW.

Простите, изображение не загрузилось :( Проверьте подключение к сети
Рис. 1. Структура 4RJW и его положение при связывании с мембраной. Слой красного цвета - внешний липидный слой, а синий - внутренний слой наружной мембраны грам-отрицательной Pseudomonas aeruginosa. Источник: OPM database

Этот белок - трансмембранный тримерный канал, осуществляющий транспорт полифосфатов (в основном пиро- и трифосфата).

В базе данных OPM для всех 3 субъединиц 4RJW указаны одни и те же координаты 16 трансмембранных участков: 29-40, 55-67, 93-99, 109-115, 119-127, 150-157, 164-171, 183-189, 201-207, 262-271, 274-281, 299-305, 335-342, 367-374, 382-387, 405-412.

Для последовательности одной субъединицы 4RJW, взятой со страницы Uniprot (ссылка), запущена программа DeepTMHMM. Результаты работы представлены на рис. 2.

Простите, изображение не загрузилось :( Проверьте подключение к сети
Рис. 2. Графический вывод программы DeepTMHMM для белка 4RJW. Пояснения в тексте.

На этом рисунке по оси Х отложены позиции в последовательности белка. На верхнем графике схематично показано расположение всего белка относительно двух липидных слоёв. Снизу по оси Y - графики вероятностей тех или иных пространственных положений данного региона последовательности белка. Красные линии соответствуют трансмембранным β-листам, зелёные - положению со внутренней стороны (стороны периплазматического пространства), синие - наружнему положению регионов. Оранжевый цвет соответствует сигналу мембранной локализации.

Вот ссылка на "сырой" файл выдачи программы, в котором координаты каждого региона белка прописаны последовательно.

Программа DeepTMHMM также обнаружила в белке 16 трансмембранных участков. Сравнение результатов двух предсказаний см. в таблице 1.

Таблица 1. Предсказания трансмембранных участков OprO
На основании структуры DeepTmHMM
29-40
55-67 56-63
80-90
93-99
99-110
109-115
119-127 115-123
131-136
150-157
164-171
173-180
183-189 186-193
201-207
208-215
224-230
262-271
274-281
288-294
299-305 298-304
335-342 325-330
359-365
367-374
382-387
393-398
405-412 404-410
430-437

Судя по этой таблице, есть трансмембранные участки белка 4RJW, которые не были обнаружены DeepTMHMM, но были обнаружены структурно, и наоборот. Показания перекрываются для 6 участков с различной точностью: от 1 до 12 аминокислотных остатков. Вероятно, причина этого кроется в существовании различных конформаций рассматриваемого белка.

Задание 2. Сравнение предсказаний трансмембранных участков в альфа-спиральном белке

Цель задания: сравнить результаты предсказаний трансмембранных участков по последовательности (с помощью DeepTMHMM) и по AlphaFold-модели структуры (сервер PPM) в α-спиральном белке.

Я буду анализировать выданный мне LrgB, антихолин-подобный белок (Antiholin-like protein LrgB, Uniprot: Q2YV65, LRGB_STAAB) золотистого стафилококка (Staphylococcus aureus, штамм bovine RF122 / ET3-1).

Этот белок ингибирует активность или экспрессию внеклеточных гидролаз муреина. Может быть вовлечён в индуцирование программируемой клеточной смерти в ответ на внешний стресс.

Для LrgB запущена программа DeepTMHMM. Результаты её работы представлены на рис. 3. Вот ссылка на "сырой" файл выдачи программы.

Простите, изображение не загрузилось :( Проверьте подключение к сети
Рис. 3. Графический вывод программы DeepTMHMM для белка LrgB. Пояснения в тексте задания 1.

К тому же вот ссылка на скачивание pdb-файла с AlphaFold-предсказанием его структуры.

Для этого файла был запущен алгоритм PPM 3.0 со следующими параметрами:

Number of Membranes: 1

Type of membrane: Gram-positive bacteria inner membrane

Allow curvature: no (рассмотрим простой вариант, у нас не мезханосенситивный канал)

Topology (N-ter): out (видно из рис. 3)

Coordinate file: lrgb.pdb

Include heteroatoms, excluding water and detergents, for positioning in membrane: yes (а почему нет).

Сравнение координат трансмембранных участков представлено в табл. 2. Также привожу ссылку на скачивание выходного файла программы в pdb-формате.

Таблица 2. Предсказания трансмембранных участков LrgB
AlphaFold DeepTmHMM
9-29 9-28
34-54 35-54
63-83 61-84
97-117 93-119
121-141 125-136
137-146
144-164 150-168
212-232 209-229

В случае альфа-спирального белка результаты предсказания намного лучше: почти все (кроме одной) предсказанные трансмембранные спирали совпали у двух алгоритмов. Предположу, что это связано с большей натренированностью программы DeepTMHMM на альфа-спиральных белках (их просто больше, чем бета-листовых). Точность предсказания 1-5 аминокислотных остатков.

Также можно отметить достаточно высокую точность предсказания структуры AlphaFold: на большей части белка значение confidence score больше 70. Для белка из предыдущего задания это значение не посчитано вовсе.