Cравнение доменов SCOP/SCOPe, ECOD, CATH и Pfam

В этом практикуме я покажу то, как различные сервисы, доступные для запуска онлайн, выделяют структурные домены в белке на примере структуры 1QFJ, в которой описывается NAD(P)H:флавин оксидоредуктаза из Escherichia coli. Будут рассмотрены следующие программы/базы данных: SCOPe, ECOD, CATH и Pfam.

Pfam

Pfam — база данных семейств белковых доменов. Был проведён поиск доменов в структуре 1QFJ. Результаты представлены на рисунке 1. Всего обнаружено два домена: FAD-связывающий типа 6 (остатки 5-97) и NAD-связывающий типа 1 (108-212).

Рис. 1 Домены, определённые в структуре 1QFJ при помощи Pfam.

SCOPe

SCOPE (Structural Classification of Proteins — extended) - база данных белков, в которой те классифицированы по сходству последовательности и по сходству пространственной структуры. Основной задачей является попытка классифицировать белки на основе их эволюционного происхождения. В структуре 1QFJ было обнаружено два домена: d1qfja1: 1qfj A: 1-97 [ССЫЛКА] и d1qfja2: 1qfj A: 98-232 [ССЫЛКА].

Рис. 2 Домены, как они выделяются в SCOPe.

СATH

В результате поиска доменов с помощью базы данных СATH, также основанной на структурном подходе к классификации белков были обнаружены два домена: 1qfjA01 (1-97) [ССЫЛКА] и 1qfjA02 (98-232) [ССЫЛКА]. На рисунке 3 представлена их классификация в CATH.

Рис. 3 Классификация обнаруженных доменов согласно CATH, можно понять какие вторичные элементы и их комбинации (укладки, например, укладка Россмана) встречаются в указанном домене.

ECOD

ECOD (Evolutionary Classification of Protein Domains) также была использована для поиска доменов. Найдены уже полюбившиеся нам два домена. Результаты представлены на рисунке 4.

Рис. 4 Домены, обнаруженные при запуске поиска по ECOD.

Выводы

В качестве примера был выбран белок со сравнительно простой (2 штуки) и очевидной доменной структурой. В результате мы получили одинаковый ответ о границах доменов от SCOPe, ECOD и CATH, где на домены была разбита вся последовательность белка. В Pfam же границы доменов несколько отличались, поскольку в Pfam домены выделяются из структуры белка в предположении, что не вся последовательность белка вовлечена в формирование доменов, и могут существовать несильноструктурированные и подвижные участки между доменами.

Дата последнего обновления: 25.12.2015
© Dmitry Travin, 2015