Мотивы. ProSite

Мотив (в контексте аминокислотных последовательностей) - некоторая последовательность аминокислот, сходная у белков, выполняющих одну функцию, выполняет роль сигнального элемента, позволяющего отличать классы белков друг от друга. Для поиска мотивов используется сервис Prosite. С его помощью осуществлялся поиск мотива для выбранного мною множественного выравнивания (в fasta-формате, проект).

В итоге сервис нашёл два мотива: PROKAR_LIPOPROTEIN и SBP_BACTERIAL_3. Для дальнейшей работы я выбрала второй мотив - SBP_BACTERIAL_3. На рисунке 1 представлено множественное выравнивание с выделенным мотивом (позиции с 72 по 85).


Рис.1. Фрагмент выравнивания, содержащий мотив SBP_BACTERIAL_3

Для данного мотива были составлены паттерны. Паттерн - это способ представления мотива в виде набора символов, по которому производится поиск белков, сожержащих этот мотив. Паттерны бывают сильными и слабыми. Чем слабее паттерн, тем больше белков находит сервис, но тем ниже вероятность гомологичности этих белков.

Сильный паттерн:

G-F-D-V-E-I-[GA]-K-X-[IV]-[GA]-K-D-L

В базе данных SwissProt не нашлось белков, совпавших с паттерном. Зато в базе Trembl - 243, причем нашлись все белки из выравнивания. Могу предположить, что находок оказалось мало, так как длина последовательности большая, и паттерн жесткий - в нем всего 1 неопределенная буква.

Слабый паттерн:

G-F-D-V-E-I-X-K-X(3)-K-D-L

В слабом паттерне больше свободных позиций (4 штуки). Однако, в базе SwissProt белков не нашлось, в базе Trembl результат слабо увеличился - 279. Видимо, данный паттерн довольно видоспецефичен (беглый взгляд на результаты выявил представителей родов Acinetobacter, Haemophilus, Paenibacillus и нескольких других - все из класса Gammaproteobacteria). Отсутствие результатов в Swissprot могу объяснить лишь очень малым количеством свободных или выборных позиций в паттерне.

Можно еще больше ослабить паттерн, а именно, для валина, изолейцина, аспарагиновой и глугаминовой кислот добавить варианты:

G-F-[DE]-[VLI]-[DE]-[VLI]-X-K-X(3)-K-[DE]-L

В базе Trembl найдется 592 последовательностей, в Swissprot - 0. Поскольку число находок не возросло во много раз, могу предположить, что сам участок очень консервативену данного типа белков (в основном, субстрат-связывающие, транспортные белки).

© Маслова Валентина, 2014
Последнее изменение: 20.05.2014