Учебный сайт Полины Байкузиной

Главная Семестры О себе Ссылки

Семейства белковых доменов

Для выполения данного практикума была взята аминокислотная последовательность белка НАД-зависимой эпимеразы-дегидратазы из организма Desulfurococcus kamchatkensis (идентификатор белка в базе данных RefSeq YP_002427953, в базе данных UniProt B8D2N2).

Задание 1. Поиск доменов Pfam в последовательности белка.

Pfam - база данных, содержащая информацию о выравниваниях белковых доменов.

Был найден всего один домен - Epimerase, семейство - Epimerase (PF01370).

Был сохранен Seed данного семейства (ссылка Alignments), содержащий 96 последовательностей (всего последовательностей 38903), fasta-формат. Полученное в JalView изображение Seed представлено на рис.1.

Рис.1. Seed семейства Epimerase, раскраска ClustalX.

Задание 2.

В данном выравнивании я выбрала в качестве блока колонки в позициях 1-11. Изображение блока представлено на рис.2, а также в окне Jalview block.

Рис.2. Изображение блока из колонок выравнивания Seed в JalView (отмечен символом B в строке BLOCK).

Блок в fasta-формате представлен здесь.

С помощью Jalview была получена консенсусная последовательность блока (fasta-формат).

По последовательностям на участке данного блока с помощью сервера http://weblogo.berkeley.edu/ был получен logo данного мотива, показывающий распространенность различных остатков в каждой из позиций (Рис. 3).

Рис.3. LOGO для одного из блоков в выравнивании последовательностей seed семейства Epimerase.

Задание 4. Паттерны.

Требовалось с помощью сервиса http://prosite.expasy.org/scanprosite построить сильный и слабый паттерны для одного из блоков или кластеров выравнивания и найти число последовательностей, содержащих мотив с данным паттерном, в БД SwissProt.

По сильному паттерну было найдено 35 последовательности. 25 последовательностей соответствуют гомологичным последовательностям из семейства, с которым я работала в предыдущем практикуме по PSI-BLAST. Остальные 10 последовательностей являются изморфными формами этих белков. Для поиска был использован следующий паттерн: [IVAL]-[LVI]-[VIL]-T-G-[AIV]-[TS]-G-[FLM]-[IVL]-G. Одной буквой обозначены позиции, в которых колонки были абсолютно консервативными. Функционально консервативные колонки были расширены до всех гидрофобных. В 7 позиции были выбраны гидрофильные аминокислоты: серин и треонин.

Для составления слабого паттерна я заменила 6, 7 и 9 позиции символом "х", так как там наблюдается вариативность кислот. Полученный слабый паттерн: [IVAL]-[LVIF]-[VIL]-[LAV]-G-x-x-G-x-[IVL]-G. По нему в базе данных SwissProt было найдено 426 последовательностей. По слабому паттерну находятся также белки-представители других семейств.

Проект в формте jvp.

© Полина Байкузина, 2014