Кристаллины -- белки, которые выполняют структурную функцию, обеспечивая прозрачность хрусталика. Но у разных организмов эти белки появлялись независимо и имеют разных предков. Целью этого практикума является поиск предков какого-либо кристаллина.
Мой организм -- геккон, кристаллин -- пи-кристаллин, а его предок -- ГАФД. Однако поиск в UniProt (команда: (protein_name:pi-crystallin)(taxonomy_id:8560)) результатов не дал. Поэтому, изменив запрос на (protein_name:crystallin)(taxonomy_id:8560) (ища просто все возможные кристаллины у гекконов), я получила два результата: Iota-crystallin (63 аминокислоты) и Rho beta-crystallin (89 аминокислот). Решила брать второй. Его идентификатор: CROB_LEPLU. Организм: Пенангский чешуепалый геккон (Lepidodactylus lugubris).
Для поиска предковых белков я использовала алгоритм Psi-blast на сайте NCBI blast. Параметры не меняла, поиск проводила по базе Swiss-prot.
В первой итерации, которая работает как обычный blastp, всего было найдено 113 последовательностей, 88 из которых имели e-value ниже порога 0.005. Первой находкой был мой исходный ро-бета кристаллин, а три последующих -- 1,5-anhydro-D-fructose reductase. 62 из всех находок были из семейства альдо-кето редуктаз (Aldo-keto reductase family).
На второй итерации находок было уже 196 (108 новых), причём, хоть и количество белков из этого семейства и увеличилось, но незначителньо: +33 последовательности и многие из них с низким e-value. Также прибавилось много других белков.
На третьей итерации белков было уже 267, объединяет их только то, что они в большинстве своём редуктазы.
На четвёртой итерации было 274 белка и появлялись уже субъединицы потенциал-зависимых калиевых каналов.
Думаю, дальше в целом можно не искать. Тем более, что на пятой итерации новых белков не нашлось.
Предком ро-бета кристаллина являются альдозоредуктазы. В результате нескольких итерации psi-blast у меня получилось найти семейство альдо-кето редуктаз, в которое входят альдозоредуктазы.