Практикум 9. Поиск предков кристаллинов с помощью PSI-BLAST

Поиск предков кристаллина фотофора кальмара Euprymna scolopes (L-кристаллин)

В рамках задания был рассмотрен L-кристаллин фотофора кальмара Euprymna scolopes. Этот белок описан в статье.
Кристаллины — это белки, выполняющие структурную функцию и обеспечивают прозрачность хрусталика. В разных группах организмов кристаллины возникали независимо. Предполагаемый предковый белок для рассматриваемого кристаллина — альдегиддегидрогеназа (ALDH).

Для поиска дальних родственников, проведем PSI-BLAST. Для самого L-кристаллина Euprymna scolopes подходящей полноразмерной записи в Swiss-Prot нет, поэтому в качестве запроса был выбран w-кристаллин (близкий гомолог судя по статье) из головоного моллюска (Octopus dofleini).
Для этого кристаллина UniProt/Swiss-Prot AC — P30841.3, длина последовательности — 496 аминокислот. Эта запись также имеет подтверждение на уровне белка.

Поиск родственных последовательностей проводился с помощью PSI-BLAST в базе данных Swiss-Prot. Было проведено 4 итерации, к моменту 4ой итерации новых последовательностей больше не появлялось.

На первой итерации было обнаружено 617 находок, среди наиболее значимых находок (E-value = 0)были альдегиддегидрогеназы (ALDH) различных организмов. Менее значимые, но также широко представленные были найдены разные другие альдегид и семиальдегид дегидрогеназы. Также в выдаче есть w-кристаллин кальмара. Это показывает, что уже обычный BLASTP, то есть первая итерация PSI-BLAST, обнаруживает выраженное сходство выбранного кристаллина с ферментами семейства ALDH.
На второй итерации число значимых находок увеличилось до 1147, за счет находок Gamma-glutamyl phosphate reductase 2 различных бактерий. Однако эти находки добавились в конец выдачи программы, то есть имеют достаточно большое E-value. Среди наиболее достоверных по-прежнему превалируют различные альдегиддегидрогеназы (retinal dehydrogenase, betaine aldehyde dehydrogenase, mitochondrial ALDH и cytosolic ALDH).
На третьей итерации было найдено 1148 значимых последовательностей, то есть по сравнению со второй итерацией добавилась только одна новая находка, причем с относительно большим E-value = 5e-45. Этой находкой стала гамма-глутамил фосфат редуктаза 2 бактерии, то есть тоже альдегиддегидрогеназа.
На четвёртой итерации число значимых находок осталось равным 1148. Новых последовательностей не появилось, поэтому поиск был остановлен.

Рис 1. P30841.3 VS Q8MI17.1.

Рис 2. P30841.3 VS P51977.2.

Рис 3. P30841.3 VS P48644.3.

На рисунках 1-3 показаны выравнивания запроса с 3мя наиболее значимыми находками. Это ретинальдегидрогеназы разных животных (корова, овца и дикий кролик). Этот фермент относится к альдегиддегидрогеназам, и, как мы видим, очень хорошо выравниваются на рассматриваемый кристаллин.

Полученные результаты хорошо согласуются с исходной литературной гипотезой. В выдаче уже с первой итерации преобладают альдегиддегидрогеназы и родственные ALDH-подобные белки. Покрытие многих выравниваний составляет около 99–100%, то есть совпадение относится не к короткому мотиву, а практически ко всей белковой последовательности. Это указывает на гомологию всего белка с ALDH, а не на случайное совпадение. PSI-BLAST постепенно расширяет круг находок от близких гомологов к более дальним представителям того же ферментативного семейства. Идентичность с близкими находками составляет 55–60%, а у дальних 15-20%.
Получается, наиболее вероятный предковый тип для L-кристаллина фотофора Euprymna scolopes — альдегиддегидрогеназа (ALDH).

Таким образом, результаты поиска подтверждают, что L/ω-кристаллины головоногих моллюсков скорее всего возникли из фермента семейства ALDH для выполнения структурной функции в оптической ткани.