Информационное содержание мотива. PSSM. PSI-BLAST

В данном практикуме было предложено провести поиск предсказанного предка для выбранного белка кристаллина или антифриза с помощью алгоритма PSI-BLAST, предназначенного для поиска далёких гомологов.

Для проведения анализа был выбран белок J3-кристаллин из кубомедузы Tripedalia cystophora. Его последовательность была взята из соответствующей записи в UniProt (UniProt AC: Q9GU96). Поиск далёких предков кристаллина проводился на сайте BLAST алгоритмом PSI-BLAST в банке белковых последовательностей Swiss-Prot (Non-redundant UniProtKB/SwissProt sequences). Все параметры были установлены по умолчанию (E-value — 0.05, матрица замен — BLOSUM62, Incision Threshold — 0.005). После первой итерации (обычного поиска с помощью BLASTp) было найдено 2 последовательности, E-value одной из которых было выше PSI-BLAST Incision Threshold, а другой — ниже, поэтому необходимо было отметить галочкой вторую последовательность, чтобы включить её в расчёт матрицы PSSM. После второй итерации было найдено ещё 22 последовательности, среди которых уже можно заметить присутствие потенциального предкового белка — сапозина-С (см. Рис. 1). В третьей итерации было найдено ещё 6 новых белков, среди которых также присутствовал возможный предок кристаллина — сапозин-B (см. Рис. 3.), в чётвертой — ещё 6, в пятой — ещё целых 20, после шестой итерации было найдено ещё больше последовательностей, поэтому было принято решение остановить поиск. Исходя из выравнивания J3-кристаллина с сапозином (см. Рис. 2, 4), можно сделать вывод, что первый содержит два домена сапозинового типа, что также подтверждается литературными данными [1].

Рис. 1. Результаты после второй итерации поиска алгоритмом PSI-BLAST по базе белков Swiss-Prot. Красной рамкой выделен предсказанный предковый белок сапозин-C. Можно заметить присутствие и других родственных белков в выдаче — просапозинов.
Рис. 2. Выравнивание J3-кристаллина из кубомедузы Tripedalia cystophora с сапозином-C морской свинки Cavia porcellus. Наличие двух отдельных выравниваний для участков рассматриваемого белка свидетельствует о наличии доменной архитектуры сапозинового типа.
Рис. 3. Результаты после третьей итерации поиска алгоритмом PSI-BLAST по базе белков Swiss-Prot. Красной рамкой выделен предсказанный предковый белок сапозин-B.
Рис. 4. Выравнивание J3-кристаллина из кубомедузы Tripedalia cystophora с сапозином-B кабана Sus scrofa.

Интересно также отметить, что, если изначально выбрать матрицу аминокислотных замен не BLOSUM62, а, например, PAM250, специально предназначенную для поиска далёких гомологов белков, результат выдачи получится таким же, только теперь после первой итерации будет достаточно последовательностей с E-value выше PSI-BLAST Incision Threshold для построения PSSM, и новые последовательности перестанут добавляться после шестой итерации.

ЛИТЕРАТУРНЫЕ ИСТОЧНИКИ

1. Piatigorsky J, Norman B, Dishaw LJ, Kos L, Horwitz J, Steinbach PJ, Kozmik Z. J3-crystallin of the jellyfish lens: similarity to saposins. Proc Natl Acad Sci U S A. 2001 Oct 23;98(22):12362-7. doi: 10.1073/pnas.231310698. PMID: 11675486; PMCID: PMC60059.