Учебный сайт Светланы Яровенко
» Семестры » Второй семестр » Мотивы, ProSite

Мотивы, ProSite

Мотив — консервативный участок последовательностей, получаемый из множественного выравнивания, который часто выполняет определённую функцию в белке и может говорить о гомологичности последовательностей. Для каждого мотива можно составить паттерн — обобщённую буквенную запись мотива.

Паттерны различаются по своей силе и соответственно цели использования. Сильный паттерн находит только гомологичные последовательности: при его составлении накладываются жёсткие условия на каждую колонку. С помощью слабого паттерна можно найти гораздо большее число гомологичных последовательностей, так как допускается большая свобода в плане изменения аминокислотных остатков.


Для поиска мотивов в 10 последовательностях из множественного выравнивания, использованного в первом практикуме по выравниваниям, я воспользовалась сервисом ProSite. В окно запроса были введены 10 последовательностей, после чего был запущен поиск. В итоге ProSite определил один мотив в данных белках — LAMININ_NTER (идентификатор PS51117). Мотив оказался довольно длинным, поэтому, основываясь на множественном выравнивании, я выбрала наиболее консервативный участок, входящий в него. Этот мотив показан на Рисунке 1. Скачать проект JalView с выравниванием можно отсюда.

Множественное выравнивание

Рисунок 1. Множественное выравнивание.
Красной рамочкой выделен мотив, для которого позже был составлен паттерн.
Изображение получено с помощью программы JalView. Окрашивание Clustalx, Conservation 70%.


На основе найденного мотива были составлены слабый и сильный паттерны.


Сильный паттерн:

S-P-[VI]-L-Q-[DE]-W-V-T-[AS]-T-D-[IVL]-[RKL]-[VI]-[VITS]-[FL]-[NHS]-[RK]-[LH]

С помощью него удалось найти 156 последовательностей, из которых 7 было из базы данных Swiss-Prot, а 149 — TrEMBL.


Слабый паттерн:

S-P-[VIL](2)-[QN]-[DE]-W-V-T-[AS]-T-[DE]-[IVLA]-x-[VIL]-x(3)-[RK]-x

При составлении слабого паттерна на x (т.е. любую аминокислоту) заменялись те позиции, где возможные аминокислотные остатки не обладали ни схожей структурой, ни схожими свойствами. Это в какой-то степени ослабило паттерн.

При поиске количество последовательностей увеличилось. Было обнаружено 267 находок: 15 из Swiss-Prot, 252 из TrEMBL.

В результате каждого поиска выпадали белки из млекопитающих, амфибий и рыб, а также различных насекомых и червей.


Английское слово как мотив для поиска в базе данных Swiss-Prot

Для проведения эксперимента я выбрала два английских слова: never (паттерн N-E-V-E-R) и always (паттерн A-L-W-A-Y-S).

Используя статистику Swiss-Prot частоты встречаемости аминокислотных остатков и считая, что в Swiss-Prot содержится около 200 млн букв, я расчитала для каждого "мотива" примерное число находок.

Для N-E-V-E-R: примерно 220 (4.05*6.74*6.87*6.74*5.53*2*108*10-10). Для A-L-W-A-Y-S: примерно 3(8.28*9.66*1.09*8.28*2.92*6.57*2*108*10-12).

Произведя поиск, я получила следующие данные для каждого "мотива": находок на A-L-W-A-Y-S было 2, а на N-E-V-E-R — 220. Забавно, что N-E-V-E-R особенно часто встречался в белках, полученных из организма человека (27 находок).


Наверх