В рамках задания был рассмотрен L-кристаллин фотофора кальмара Euprymna scolopes. Этот белок описан в статье.
Кристаллины — это белки, выполняющие структурную функцию и обеспечивают прозрачность хрусталика. В разных группах организмов кристаллины возникали независимо.
Предполагаемый предковый белок для рассматриваемого кристаллина — альдегиддегидрогеназа (ALDH).
Для поиска дальних родственников, проведем PSI-BLAST. Для самого L-кристаллина Euprymna scolopes подходящей полноразмерной записи в Swiss-Prot нет, поэтому в качестве запроса был выбран w-кристаллин (близкий гомолог судя по статье) из головоного моллюска (Octopus dofleini).
Для этого кристаллина UniProt/Swiss-Prot AC — P30841.3, длина последовательности — 496 аминокислот. Эта запись также имеет подтверждение на уровне белка.
Поиск родственных последовательностей проводился с помощью PSI-BLAST в базе данных Swiss-Prot. Было проведено 4 итерации, к моменту 4ой итерации новых последовательностей больше не появлялось.
На первой итерации было обнаружено 617 находок, среди наиболее значимых находок (E-value = 0)были альдегиддегидрогеназы (ALDH) различных организмов. Менее значимые, но также широко представленные были найдены разные другие альдегид и семиальдегид дегидрогеназы. Также в выдаче есть w-кристаллин кальмара.
Это показывает, что уже обычный BLASTP, то есть первая итерация PSI-BLAST, обнаруживает выраженное сходство выбранного кристаллина с ферментами семейства ALDH.
На второй итерации число значимых находок увеличилось до 1147, за счет находок Gamma-glutamyl phosphate reductase 2 различных бактерий. Однако эти находки добавились в конец выдачи программы, то есть имеют достаточно большое E-value. Среди наиболее достоверных по-прежнему превалируют различные альдегиддегидрогеназы (retinal dehydrogenase, betaine aldehyde dehydrogenase, mitochondrial ALDH и cytosolic ALDH).
На третьей итерации было найдено 1148 значимых последовательностей, то есть по сравнению со второй итерацией добавилась только одна новая находка, причем с относительно большим E-value = 5e-45. Этой находкой стала гамма-глутамил фосфат редуктаза 2 бактерии, то есть тоже альдегиддегидрогеназа.
На четвёртой итерации число значимых находок осталось равным 1148. Новых последовательностей не появилось, поэтому поиск был остановлен.
На рисунках 1-3 показаны выравнивания запроса с 3мя наиболее значимыми находками. Это ретинальдегидрогеназы разных животных (корова, овца и дикий кролик). Этот фермент относится к альдегиддегидрогеназам, и, как мы видим, очень хорошо выравниваются на рассматриваемый кристаллин.
Полученные результаты хорошо согласуются с исходной литературной гипотезой. В выдаче уже с первой итерации преобладают альдегиддегидрогеназы и родственные ALDH-подобные белки.
Покрытие многих выравниваний составляет около 99–100%, то есть совпадение относится не к короткому мотиву, а практически ко всей белковой последовательности. Это указывает на гомологию всего белка с ALDH, а не на случайное совпадение.
PSI-BLAST постепенно расширяет круг находок от близких гомологов к более дальним представителям того же ферментативного семейства.
Идентичность с близкими находками составляет 55–60%, а у дальних 15-20%.
Получается, наиболее вероятный предковый тип для L-кристаллина фотофора Euprymna scolopes — альдегиддегидрогеназа (ALDH).
Таким образом, результаты поиска подтверждают, что L/ω-кристаллины головоногих моллюсков скорее всего возникли из фермента семейства ALDH для выполнения структурной функции в оптической ткани.