Множественное выравнивание.
Для выполения данного практикума была взята аминокислотная последовательность белка
из организма Gordonibacter pamelaeae 7-10-1-b (идентификатор белка в базе данных RefSeq YP_007803476.1, в базе данных UniProt D6EBI6).
По данным Pfam в последовательности этого белка встречается один домен -
Pribosyltran.
Используя программу cons (сервер
http://emboss.bioinformatics.nl/),
я нашла консенсусную последовательность для блока (146-154 а.к.) из множественного выравнивания белков семейства Pribosyltran.
>EMBOSS_001/146-154
VKGKxVLIV
С помощью сервиса
http://weblogo.berkeley.edu/ я изобразила наиболее часто встречающиеся аминокислоты в выбранном блоке (Рис.1).
Построение паттернов.
Для выбранного блока я построила паттерны, показывающие наиболее часто встречающиеся аминокислоты.
Для поиска использовался сервис
http://prosite.expasy.org/scanprosite/.
Слабый паттерн находит гораздо больше белков, чем есть в семействе Pribosyltran (30853 белок),
поскольку включает практически все аминокислоты, встречающиеся в выбранном блоке.
Также это может быть связано с тем, что тимидилат синтазы являются очень распространёнными
белками, т.к. учавствуют в синтезе ДНК. Поэтому в различных модификациях мотивы этого семейства
могут встречаться во многих белках.Сильный и самый сильный паттерны более строго определяют возможные
аминокислоты. Количество находок самого сильного паттерна сравнимо с размером seed семейства (71 белка),
но часть белков не была найдена.
Находки по паттернам
|
Паттерн |
Количество находок |
Сильный |
x-K-G-K-R-[VIAG]-[LVI]-[ILV]-[VIL] |
63 |
Слабый |
x-x-[GND]-x-[RKT]-[VIAG]-[LVI]-[ILV]-[VIL] |
10 362 |
СПАСИБО ЗА ПРОСМОТР
© Мария Медведева