Информационное содержание мотива. PSSM. PSI-BLAST
В данном практикуме было предложено провести поиск предсказанного предка для выбранного белка кристаллина или антифриза с помощью алгоритма PSI-BLAST, предназначенного для поиска далёких гомологов.
Для проведения анализа был выбран белок J3-кристаллин из кубомедузы Tripedalia cystophora. Его последовательность была взята из соответствующей записи в UniProt (UniProt AC: Q9GU96). Поиск далёких предков кристаллина проводился на сайте BLAST алгоритмом PSI-BLAST в банке белковых последовательностей Swiss-Prot (Non-redundant UniProtKB/SwissProt sequences). Все параметры были установлены по умолчанию (E-value — 0.05, матрица замен — BLOSUM62, Incision Threshold — 0.005). После первой итерации (обычного поиска с помощью BLASTp) было найдено 2 последовательности, E-value одной из которых было выше PSI-BLAST Incision Threshold, а другой — ниже, поэтому необходимо было отметить галочкой вторую последовательность, чтобы включить её в расчёт матрицы PSSM. После второй итерации было найдено ещё 22 последовательности, среди которых уже можно заметить присутствие потенциального предкового белка — сапозина-С (см. Рис. 1). В третьей итерации было найдено ещё 6 новых белков, среди которых также присутствовал возможный предок кристаллина — сапозин-B (см. Рис. 3.), в чётвертой — ещё 6, в пятой — ещё целых 20, после шестой итерации было найдено ещё больше последовательностей, поэтому было принято решение остановить поиск. Исходя из выравнивания J3-кристаллина с сапозином (см. Рис. 2, 4), можно сделать вывод, что первый содержит два домена сапозинового типа, что также подтверждается литературными данными [1].
Интересно также отметить, что, если изначально выбрать матрицу аминокислотных замен не BLOSUM62, а, например, PAM250, специально предназначенную для поиска далёких гомологов белков, результат выдачи получится таким же, только теперь после первой итерации будет достаточно последовательностей с E-value выше PSI-BLAST Incision Threshold для построения PSSM, и новые последовательности перестанут добавляться после шестой итерации.