Практикум посвящен предсказанию доменов белка 1CG2 алгоритмом DOMAK

Задание 1

Ноутбук с реализацией алгоритма.

Для цепи В белка 1CG2 на выходе получаем следующие значения split_value для аминокислотных остатков. Высокие значения слева и справа на графике похожи на какие-то краевые эффекты. В средней части последовательности наблюдаются пики в области остатков с номерами 200 (наибольший пик), 100 и 320 — эти участки соответствуют предполагаемым границам доменов.

scene in pymol
Рис.1. График зависимости split_value от номера остатка

При визуализации обнаружил, что остатки в области 200 и 320 действительно на структуре составляют два участка без вторичной структуры, которые соединяют две части белка внешне похожие на структурные домены.

scene in pymol
Рис.2. Граница доменов согласно DOMAK

А вот остатки в районе 100-го оказались расположены в петле на поверхности белка, вряд ли это граница доменов.

Задание 2

Данные о доменах из баз SCOP и CATH подтвердили соображения из предыдущего задания, хотя в номерах остатков границ доменов есть сдвиг вниз.

scene in pymol
Рис.3. Разметка доменов согласно CATH и SCOP. Данные взяты с PDB страницы записи 1CG2

Задание 3

Поиск эволюционных доменов с помощью веб-сервиса InterProScan на сайте базы данных InterPro дал следующие результаты:

scene in pymol
Рис.4. Разметка доменов 1CG2 согласно InterPro

Границы найденных эволюционных доменов совпадают со структурными доменами из баз SCOP и CATH.

Найденные эволюционные домены ассоциированы с функциями белка. 1CG2 это металлокарбоксипепидаза, которая отщепляет аминокислоты с С-конца и работает в состоянии димера, а оба домена отвечают за образование поверхности димеризации представителей семейства пептидаз.

Pymol сессия: domak.pse