В рамках данного практикума был произведён поиск предка белка λ-кристаллин человека. Последовательность этого белка была получена из NCBI Nucleotide по идентификатору NM_015974.3 (был указан CDS). Соответствующий белковый продукт в базе Swiss-Prot имеет идентификатор CRYL1_HUMAN (доступ Q9Y2S2).
Белки кристаллины выполняют, главным образом, структурные функции. Они обеспечивают прозрачность хрусталика. Похоже, что разные группы организмов независимо решали эту задачу, и “изобретали” соответствующие белки разными способами.
Для поиска предков была использована база данных Swiss-Prot и использован PSI-BLAST. Ниже приведены описания его запуска (все параметры были выставлены по умолчанию).
После первой итерации нашлось 228 последовательностей. Среди результатов присутсвуют: сам белок Lambda-crystallin (λ-кристаллин с альтернативным названием L-gulonate 3-dehydrogenase), его гомологи Lambda-crystallin homolog (с альтернативным названием L-gulonate 3-dehydrogenase), L-carnitine dehydrogenase (L-карнитин дегидрогеназа), 5-formyl-3-hydroxy-2-methylpyridine 4-carboxylate 5-dehydrogenase (мамочки), 3-hydroxybutyryl-CoA dehydrogenase, Fatty acid oxidation complex subunit alpha и ещё несколько других.
После второй итерации нашлось 353 последовательностей, 282 из которых с E-value меньше порога, то есть нашлось ещё 54 белка. Среди результатов присутсвуют: те же белки, что и из первой итерации; Glycerol-3-phosphate dehydrogenase [NAD(P)+]; UDP-N-acetyl-D-mannosamine dehydrogenase; Malate dehydrogenase и ещё немного.
После третьей итерации нашлось 1289 последовательностей, 1113 из которых с E-value меньше порога, то есть нашлось ещё 831 белок. Однако среди результатов мало тех, у которых E-value не близок к 0,005. Присутсвуют: те же белки, что и из прошлых итераций; Mannitol-1-phosphate 5-dehydrogenase; Ketol-acid reductoisomerase (NADP(+)) и ещё некоторые с большим E-value.
После четвёртой итерации нашлось 2093 последовательностей, 1920 из которых с E-value меньше порога, то есть нашлось ещё 807 белков. Последовательностей дальше становится всё больше (на пятой: 2095, на шестой: 2318, на седьмой: 2680), а также пропал кристалин с первых позиций находок, поэтому тут было решено остановиться. Значимых (на мой взгляд) белков на этой итерации обнаружено не было.
Так как по сути своей λ-кристаллин является L-гулонат-3-дегидрогеназа, то получается, что он был найден при первом же запуске программы. Дальними родственниками для выбранного белка являются:
Все они относятся к суперсемейству NAD(P)-зависимых дегидрогеназ, что может говорить о том, что выбранный белок происходит из него.