семейства белковых доменов



Множественное выравнивание.
Для выполения данного практикума была взята аминокислотная последовательность белка из организма Gordonibacter pamelaeae 7-10-1-b (идентификатор белка в базе данных RefSeq YP_007803476.1, в базе данных UniProt D6EBI6).
По данным Pfam в последовательности этого белка встречается один домен - Pribosyltran.
Используя программу cons (сервер http://emboss.bioinformatics.nl/), я нашла консенсусную последовательность для блока (146-154 а.к.) из множественного выравнивания белков семейства Pribosyltran.

>EMBOSS_001/146-154
VKGKxVLIV

С помощью сервиса http://weblogo.berkeley.edu/ я изобразила наиболее часто встречающиеся аминокислоты в выбранном блоке (Рис.1).

Построение паттернов.

Для выбранного блока я построила паттерны, показывающие наиболее часто встречающиеся аминокислоты. Для поиска использовался сервис http://prosite.expasy.org/scanprosite/.
Слабый паттерн находит гораздо больше белков, чем есть в семействе Pribosyltran (30853 белок), поскольку включает практически все аминокислоты, встречающиеся в выбранном блоке. Также это может быть связано с тем, что тимидилат синтазы являются очень распространёнными белками, т.к. учавствуют в синтезе ДНК. Поэтому в различных модификациях мотивы этого семейства могут встречаться во многих белках.Сильный и самый сильный паттерны более строго определяют возможные аминокислоты. Количество находок самого сильного паттерна сравнимо с размером seed семейства (71 белка), но часть белков не была найдена.

Находки по паттернам
Паттерн Количество находок
Сильный x-K-G-K-R-[VIAG]-[LVI]-[ILV]-[VIL] 63
Слабый x-x-[GND]-x-[RKT]-[VIAG]-[LVI]-[ILV]-[VIL] 10 362

СПАСИБО ЗА ПРОСМОТР


© Мария Медведева