Учебный сайт Мухалевой Лизаветы

Мотивы, MEME & ProSite

       На этом практикуме нам объяснили, что такое мотивы. Одно из значений мотива - некоторая последовательность аминокислот, сходная у белков одного класса (выполняющих одну функцию) и выполняющая роль сигнального элементы, позволяю отличать классы белков друг от друга. И для поиска таких мотивов был придуман сервис Prosite. Именно с его помощью я искала мотив для выбранного мною множественного выравнивания (его можно скачать по ссылке, проект с выравниванием можно скачать по данной ссылке).
В итоге сервис нашёл два мотива: IG_LIKE и IG_MHC. Для дальнейшей работы я выбрала второй мотив - IG_MHC - Immunoglobulins and major histocompatibility complex proteins signature (маркёрная последовательность для иммуноглобулинов и главного комплекса гистосовместимости). На рисунке 1 представлено множественное выравнивание с выделенными позициями №№ 389-395 - это и есть блок мотива.

Рисунок 1. Множественное выравнивание с выделенным участком мотива. Окраска Clustalx. Консервативность > 70%.

       Для данного мотива были составлены паттерны. Паттерн - это графическая запись мотива, по которой производится поиск белков, сожержащих этот мотив. Паттерны бывают сильными и слабыми. Чем слабее паттерн, тем больше белков находит сервис, причём далеко не все будут гомологичны.
Сильный паттерн: Y-[TQ]-C-[LHR]-V-[EY]-H. Этот паттер позволяет найти все последовательности из выравнивания, также по нему было найдено 32 последовательности в Swissprot и 1513 последовательность в Tremble (а сопадений 1515 - значит, в паре белков данный мотив встретился дважды), причем все последовательности из выравнивания найдены в Tremble.
В принципе, можно ещё более ужесточить паттерн, но тогда будут надены не все белки из выравнивания. Поставим на вторую позицию лишь букву Т вместо выбора между Т и Q, тогда паттерн станет следующим: Y-T-C-[LHR]-V-[EY]-H. По такому паттерну были найдены 31 последовательность в Swissprot и 1191 последовательность в Tremble (1193 совпадения), три последовательности, содержащие T на второй позиции мотива, были найдены в Tremble.

       Теперь на основе первого сильного паттерна был построен слабый: Y-X-C-X-V-X-H. Было надено 497 последовательностей (508 совпадений) в Swissprot и 24716 в Tremble (совпадений 24995). Быстрого просмотра результатов Swissprot показал, что большинство найденных белков все-таки являются иммуноглобулинами и белками комплекса гистосовместимости, а помимо них ещё часто встречаются различные трасферазы и белки мембраны.

       Также был найден паттерн, указанный в Pfam: [FY]-{L}-C-{PGAD}-[VA]-{LC}-H. По нему было найдено 718 последовательностей в Swissprot (766 совпадений), что означает, что это ещё более слабабый паттерн, чем составленный мною.

© Mukhaleva Elizaveta, FBB MSU, 2013
Дата последнего изменения: 17.04.2014

Valid HTML 4.01 Strict Правильный CSS!