Мотивы – консервативные участки белков. В качестве исходного набора я взял 5 последовательностей из множественного выравнивания 9 практикума. Поиск мотивов из базы данных Prosite можно осуществить с помощью этого сервиса.
Без учета мотивов в высокой частотой встречаемости было найдено 2 мотива, входящие в состав всех последовательностей. Их идентификаторы: PS00888 и PS00889. Оба являются доменами, отвечающими за связывание с циклическими нуклеотидами.
Будем рассматривать первый из них, он имеет длину 17 аминокислотных остатков. В выравнивании (рисунок 1) располагается с 10 по 26 позиции.
Рисунок 1. Найденный мотив связывания циклических нуклеотидов (10 – 26 аминокислотные остатки, выделен красным). Покраска – Clustalx с консервативностью больше 70%
Общий паттерн такого мотива следующий:
[LIVM]-[VIC]-x-{H}-G-[DENQTA]-x-[GAC]-{L}-x-[LIVMFY](4)-x(2)-G
Это довольно слабый паттерн, по нему в базе данных Swiss-Prot детектируется 156 белков, при чем мотивов найдено 222. То есть несколько последовательностей, в которых мотив встречается дважды, либо паттерн не отличает шум от искомого мотива. В базе TrEMBL – 8399 белков, включающих 10274 мотива.
По моей небольшой выборке можно составить более сильный паттерн, соответствующий строго моему множественному выравниванию:
[VI]-I-R-E-G-E-[EK]-G-[NDS]-[TL]-F-[FY]-I-[IL]-[ATS]-[KSN]-G
При этом в базе данных Swiss-Prot всего 4 находки, а в TrEMBL – 83. На каждой последовательности по одному паттерну.
Последнее обновление: 29.02.2016