Семейства белковых доменов

Чтобы определить, к какому домену пренадлежит белок, можно использовать сайт банка данных семейств белков - Pfam.
Был взят белок тимидилат синтаза thyX (thymidylate synthase thyX). По данным Pfam в последовательности этого белка встречается один домен - Thy1.
Используя программу cons (сервер http://emboss.bioinformatics.nl/), я нашла консенсусную последовательность для блока (413-418 а.к.) из множественного выравнивания белков семейства Thy1.
    >consensus
    ARxVLP
»Множественное выравнивание

С помощью сервиса http://weblogo.berkeley.edu/ я наглядно изобразила наиболее часто встречающиеся аминокислоты в этом блоке (Рис.1).
Рис.1

Построение паттернов

Для выбранного блока я построила паттерны, показывающие наиболее часто встречающиеся аминокислоты. Для поиска использовался сервис http://prosite.expasy.org/scanprosite/.
Слабый паттерн находит гораздо больше белков, чем есть в семействе Thy1 (1591 белок), поскольку включает практически все аминокислоты, встречающиеся в выбранном блоке. Также это может быть связано с тем, что тимидилат синтазы являются очень распространёнными белками, т.к. учавствуют в синтезе ДНК. Поэтому в различных модификациях мотивы этого семейства могут встречаться во многих белках.
Сильный и самый сильный паттерны более строго определяют возможные аминокислоты. Количество находок самого сильного паттерна сравнимо с размером seed семейства (163 белка), но часть белков не была найдена.
    Находки по паттернам
    Паттерн Количество находок
    Самый сильный A-R-[YFMI]-[VILA]-L-P 148
    Сильный A-[RKQ]-[YFMI]-[VILA]-L-P 343
    Слабый A-[RKQL]-x-[VILAN]-[LVFM]-[PTL] 11 214
«Назад

© Колупаева А.Л. 2014