Практикум 9. Информационное содержание мотива. PSSM. PSI-BLAST


В качестве исследуемого белка был выбран О-кристаллин осьминога Enteroctopus dofleini, GenBank AC — AAD29640.1. Кристаллины представляют собой основные структурные белки хрусталика глаза животных. Согласно литературным данным, предковыми белками О-кристаллинов являются белки суперсемейства липид-связывающих белков. Цель данного практикума — с помощью сервиса PSI-BLAST найти дальние гомологи исследуемого белка.

Сначала была проведена первая итерация PSI-BLAST для последовательности данного белка (AAD29640.1), которая по своей сути является обычным blastp. Поиск проводился по базе данных Swiss-Prot. Остальные параметры были оставлены по умолчению. В результате нашлось 48 последовательностей. Среди них можно сразу заметить липид-связывающие белки: белки, связывающие фосфатидилэтаноламин (O16264.1, P13696.2, Q5R4R0.3 и другие); Protein D3 (P54188.1), Protein D2 (P54187.1), Protein D1 (P54186.1), Large ribosomal subunit protein mL38 (Q3ZBF3.2, Q5PQN9.2 и другие), CEN-like protein 1 (Q9XH44.1) и прочие (относятся к суперсемейству phosphatidylethanolamine-binding protein); а также антиген Toxocara excretory-secretory antigen 2 (P54190.1). Выдача первой итерации PSI-BLAST. На рис. 1 изображено выравнивание одной из лучших находок и исходной последовательности.

Картинка
Рисунок 1. Выравнивание исходной последовательности О-кристаллина Enteroctopus dofleini с одной из самых лучших находок (AC SwissProt — O16264.1). Как можно видеть, в данном выравнивании 73 идентичные колонки и 108 похожих колонок из 181. Скорее всего, данные колонки соответствуют каким-то консервативным сайтам, например, сайтам связывания субстратов (в данном случае фосфатидилэтаноламина).

В результате второй итерации PSI-BLAST было найдено 68 последовательностей, то есть было найдено 18 новых последовательностей. Среди них нашлись новые последовательности, которые принадлежат к phosphatidylethanolamine-binding protein family: UPF0098 protein PH1269 (O58984.1), Phomoidride biosynthesis cluster protein N (B8MKZ5.1), UPF0098 protein SCO1794 (Q9X9Z8.1) и другие. Файл выдачи второй итерации PSI-BLAST.

На третьей итерации PSI-BLAST нашлась еще 1 последовательность: UPF0098 protein AF_1698 (O28575.1). Данный белок тоже относится к суперсемейству фосфатидилэтаноламин-связывающим белкам. Файл выдачи третьей итерации PSI-BLAST.

На четвертой итерации новых последовательностей не было найдено.

Таким образом, благодаря PSI-BLAST нами было идентифицировано значительное число представителей семейства липид-связывающих белков, что подтверждает литературные данные о гомологии О-кристаллина осьминога и липид-связывающих белков.