ProSite
ProSite
Главная

Поиск мотива

Для анализа были взяты 9 последовательностей из выравнивания, используемого в практикуме 9. В результате поиска в ProSite для дальнейшей работы был выбран IG_LIKE мотив (выделен на рис. 1). В выравнивании находится в 293-381 позициях.

Рис. 1. Используемое выравнивание. Красной рамочкой обозначен мотив IG_LIKE

IG_LIKE домены (входят в состав иммуноглобулинов) обычно участвуют в специфичном связывании различных лигандов, что отражается в разнообразии их аминокислотного состава. Общей чертой доменов этого семейства является определённая конфигурация бэтта-листов. Помимо этого, цепь белка в области домена стабилизируется дисульфидными связями, что также отражено в аминокислотном составе [1]. Эти факты могут говорить о том, что есть некоторое количество абсолютно или почти консервативных позиций и большое число вариабельных позиций между ними, аминокислотный состав которых зависит от функции конкретного белка. Составление сильного паттерна может позволить найти представителей нескольких функциональных семейств, представленных в данном выравнивании (для поиска представителей определённого функционального семейства требуется анализ функции каждого из белков и выявление соответствующих особенностей в составе), а составление слабого, но с сохранением консервативных позиций – представителей белов-иммуноглобулинов, чьё разнообразие велико.

Составление паттерна

Сильный паттерн был составлен таким образом, чтобы в него были включены наиболее консервативные позиции. Возможности составить подробный паттерн с множеством условий не было из-за лимита на его длину, поэтому позиции с числом аминокислот больше двух считались вариабельными и включались в паттерн как «x». При выборе позиций, для которых можно выбрать определённый набор возможных аминокислоты, предпочтение отдавалось позициями внутри крупных блоков, межу консервативными позициями.

Сильный паттерн выглядит следующим образом:

P-x(3)-V-x(9,10)-T-L-x-C-x-A-x(2)-F-Y-P-x(2)-I-x(2)-[TS]-W-x(2)-[ND]-G-x(4)-
Q-[DE]-x(3)-[VG]-x-[TI]-[RL]-P-x-[GS]-D-G-[TN]-[FY]-[QH]-x-W-A-x(2)-[VE]-        
[VL]-x(7)-Y-x-C-x-V-x-H-x(2)-[LV]-x(7)-[WQ]

В результате поиска по сильному паттерну было найдено 53 последовательности в SwissProt и 3058 в TrEMBL.

Слабый паттерн был составлен для участка выравнивания с координатами 308-324. Он выглядит следующим образом:

T-L-x-C-x-A-x(2,7)-[FWHY]-[FYWH]-P-x(2,7)-[TSYQN]-[IL]-x(1,7)-[WYHF]

В результате поиска по слабому паттерну было найдено 127 последовательностей в SwissProt и 8026 в TrEMBL. Большинство находок относится к белкам MHC (главного комлекса гистосовместимости) различных организмов.

С помощью одной из опций ресурса ProSite (устанавливает соответствие между введёнными последовательностями и мотивом) было выяснено, что, как слабый, так и сильный паттерны присутствуют во всех последовательностях исходного выравнивания.

[1] http://prosite.expasy.org/cgi-bin/prosite/nicedoc.pl?PS50835

Обо мне
Ссылки


Valid HTML 4.01 Transitional