Цель задания: сравнить результаты предсказаний трансмембранных участков по последовательности (с помощью DeepTMHMM) и по трехмерной структуре (база данных OPM) в β-листовом белке.
Объект исследования: порин OprO (porin OprO, Uniprot ID: P32977, PDB ID: 4RJW) грам-отрицательной бактерии Pseudomonas aeruginosa. Далее для краткости я буду использовать сокращение 4RJW.
Этот белок - трансмембранный тримерный канал, осуществляющий транспорт полифосфатов (в основном пиро- и трифосфата).
В базе данных OPM для всех 3 субъединиц 4RJW указаны одни и те же координаты 16 трансмембранных участков: 29-40, 55-67, 93-99, 109-115, 119-127, 150-157, 164-171, 183-189, 201-207, 262-271, 274-281, 299-305, 335-342, 367-374, 382-387, 405-412.
Для последовательности одной субъединицы 4RJW, взятой со страницы Uniprot (ссылка), запущена программа DeepTMHMM. Результаты работы представлены на рис. 2.
На этом рисунке по оси Х отложены позиции в последовательности белка. На верхнем графике схематично показано расположение всего белка относительно двух липидных слоёв. Снизу по оси Y - графики вероятностей тех или иных пространственных положений данного региона последовательности белка. Красные линии соответствуют трансмембранным β-листам, зелёные - положению со внутренней стороны (стороны периплазматического пространства), синие - наружнему положению регионов. Оранжевый цвет соответствует сигналу мембранной локализации.
Вот ссылка на "сырой" файл выдачи программы, в котором координаты каждого региона белка прописаны последовательно.
Программа DeepTMHMM также обнаружила в белке 16 трансмембранных участков. Сравнение результатов двух предсказаний см. в таблице 1.
На основании структуры | DeepTmHMM |
---|---|
29-40 | |
55-67 | 56-63 |
80-90 | |
93-99 | |
99-110 | |
109-115 | |
119-127 | 115-123 |
131-136 | |
150-157 | |
164-171 | |
173-180 | |
183-189 | 186-193 |
201-207 | |
208-215 | |
224-230 | |
262-271 | |
274-281 | |
288-294 | |
299-305 | 298-304 |
335-342 | 325-330 |
359-365 | |
367-374 | |
382-387 | |
393-398 | |
405-412 | 404-410 |
430-437 |
Судя по этой таблице, есть трансмембранные участки белка 4RJW, которые не были обнаружены DeepTMHMM, но были обнаружены структурно, и наоборот. Показания перекрываются для 6 участков с различной точностью: от 1 до 12 аминокислотных остатков. Вероятно, причина этого кроется в существовании различных конформаций рассматриваемого белка.
Цель задания: сравнить результаты предсказаний трансмембранных участков по последовательности (с помощью DeepTMHMM) и по AlphaFold-модели структуры (сервер PPM) в α-спиральном белке.
Я буду анализировать выданный мне LrgB, антихолин-подобный белок (Antiholin-like protein LrgB, Uniprot: Q2YV65, LRGB_STAAB) золотистого стафилококка (Staphylococcus aureus, штамм bovine RF122 / ET3-1).
Этот белок ингибирует активность или экспрессию внеклеточных гидролаз муреина. Может быть вовлечён в индуцирование программируемой клеточной смерти в ответ на внешний стресс.
Для LrgB запущена программа DeepTMHMM. Результаты её работы представлены на рис. 3. Вот ссылка на "сырой" файл выдачи программы.
К тому же вот ссылка на скачивание pdb-файла с AlphaFold-предсказанием его структуры.
Для этого файла был запущен алгоритм PPM 3.0 со следующими параметрами:
Number of Membranes: 1
Type of membrane: Gram-positive bacteria inner membrane
Allow curvature: no (рассмотрим простой вариант, у нас не мезханосенситивный канал)
Topology (N-ter): out (видно из рис. 3)
Coordinate file: lrgb.pdb
Include heteroatoms, excluding water and detergents, for positioning in membrane: yes (а почему нет).
Сравнение координат трансмембранных участков представлено в табл. 2. Также привожу ссылку на скачивание выходного файла программы в pdb-формате.
AlphaFold | DeepTmHMM |
---|---|
9-29 | 9-28 |
34-54 | 35-54 |
63-83 | 61-84 |
97-117 | 93-119 |
121-141 | 125-136 |
137-146 | |
144-164 | 150-168 |
212-232 | 209-229 |
В случае альфа-спирального белка результаты предсказания намного лучше: почти все (кроме одной) предсказанные трансмембранные спирали совпали у двух алгоритмов. Предположу, что это связано с большей натренированностью программы DeepTMHMM на альфа-спиральных белках (их просто больше, чем бета-листовых). Точность предсказания 1-5 аминокислотных остатков.
Также можно отметить достаточно высокую точность предсказания структуры AlphaFold: на большей части белка значение confidence score больше 70. Для белка из предыдущего задания это значение не посчитано вовсе.