Чтобы найти мотив (консервативный участок последовательностей) и построить для него сильный (тот, с помощью которого, в идеале, находятся только гомологичные последовательности) и слабый (тот, с помощью которого, в идеале, находятся все мотивы) паттерны был использован сервис Prosite.
Поиск мотивов был произведён для fasta-файла, содержащего последовательность белка холецистокинин-A рецептора голого землекопа (Heterocephalus glaber) и несколько последовательностей его гомологов. Холецистокинин (панкреозимин, CCK) - нейромедиаторный пептид был обнаружен в мозге и пищеварительной системе человека. ССК взаимодействует с двумя типами рецепторов. CCK-A рецепторы стимулирует сокращения желчного пузыря, а CCK-B рецепторы участвуют в регуляции механизмов психической напряженности, страха и боли.
В каждой последовательности был обнаружен мотив G_PROTEIN_RECEP_F1_2(G-protein coupled receptors family 1). Он занимает всю последовательность белка. На рис.1 показан данный мотив для одной из последовательностей. На рис.2 показано множественное выравнивание для данных последовательностей.
Рисунок 1. Мотив у одной из последовательностей, найденный при помощи Prosite.
Рисунок 2. Множественное выравнивание гомологов.
Так как данный мотив слишком большой, паттерны были составлены только для некоторой его части. Ниже представлен сильный паттерн:
G-N-X(12)-M-X(1,2)-[TSN]-X(2)-N-X-[FY]-[LI]-X-[SN]-[LM]-[AS]-[VIAL]-[SA]-D-[LM]-[LM]-X(5)-[MI]-P-X(10,11)-[FWY]-X(15,20)-[SN]-X(2)-[TN]-X(6)-[ED]-R-[YF]-X(5)-P-X(17,19)-W-X(24,33)-C
С его помощью было найдено 6 последовательностей в базе данных Swiss-Prot и 156 в TrEMBL. У первых находок был найден тот же мотив.
Слабый паттерн для данного мотива выглядит так:
G-N-X(1,12)-M-X(1,5)-N-X-[FY]-[LI]-X-[SN]-[LM]-[AS]-X-[SA]-D-[LM]-[LM]-X(1,5)-[MI]-P-X(1,11)-[FWY]-X(1,20)-[SN]-X(1,2)-[TN]-X(1,6)-[ED]-R-[YF]-X(1,5)-P-X(1,19)-W-X(1,33)-C
Некоторые аминокислоты были заменены на случайные, сильно уменьшены минимальные ограничения по длине для случайных фрагментов последовательности. Получено 8 результатов для Swiss-Prot и 256 для TrEMBL. Для данных результатов длина больше варьируется.
Скачать проект JalView можно по этой ссылке.