Знакомстов с UniProt
В этом практиме мы познамимся с банком последовательностей белков UniProt и узнаем основную информацию о белке CUTC_DESAG.
Получение данных о белке CUTC_DESAG.
Благодаря использованию базы данных UniProt,
была получена информация о нашем белке.
Сначала, при помощи формы "Retrieve/ID mapping" был найден нужный белок в
UniProt.
Затем с использованием текста задания, была найдена информация о белке в текстовом документе на странице UniProt.
Полученная информация представлена в таблице 1.
UniProt ID | UniProt AC | RefSeq ID | PDB ID | Длина белка (а.о.) | Молекулярная масса (Да) | Рекомендуемое название |
---|---|---|---|---|---|---|
CUTC_DESAG | Q30W70 | WP_011369019.1 | 5FAU; 5FAV; 5FAW; 5FAY; 5KDP | 846 | 94640 | Choline trimethylamine-lyase |
База данных UniProt оказалась достаточно удобной для анализирования информации. Так же впечатляет полнота данных о белке которую можно получить на UniProt. Например: у белка CUTC_DESAG оказалось несколько PDB структур.
Поиск белка CUTC_DESAG в UniRef.
В данном задании были описаны кластеры UniRef белка CUTC_DESAG. В таблице 2 представлены результаты поиска в базе данных UniRef
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef100_Q30W70 | Choline trimethylamine-lyase | 1 |
UniRef90 | UniRef90_Q30W70 | Choline trimethylamine-lyase | 6 |
UniRef50 | UniRef50_Q30W70 | Choline trimethylamine-lyase | 510 |
Работать в базе данных UniRef оказалось просто и очень удобно, поэтому выполнить задание не оказалось трудным.
Сеансы поиска в UniProt
Для знакомства с базой данных UniProt и синтаксисом запросов были проведены следующие сеансы поиска:
Поиск холинтриметиламинлиазы
Поиск в UniProt по рекомендованному названию белка
Текст запроса: name:"choline trimethylamine lyase"
Количество находок в Swiss-Prot: 2
Общее количество находок: 901
Поиск по рекомендованному названию белка среди белков данного организма
Текст запроса: name:"choline trimethylamine lyase" taxonomy:"desulfovibrio alaskensis"
Количество находок в Swiss-Prot: 2
Общее количество находок: 2
Поиск по рекомендованному названию белка среди огранизмов семейства, к которому принадлежит данный организм
Текст запроса: name:"choline trimethylamine lyase" taxonomy:"desulfovibrionaceae"
Количество находок в Swiss-Prot: 2
Общее количество находок: 34
Поиск по рекомендованному названию белка среди организмов данного отдела
Текст запроса: name:"choline trimethylamine lyase" taxonomy:"deltaproteobacteria"
Количество находок в Swiss-Prot: 2
Общее количество находок: 47
Поиск гистонов
Поиск гистонов без ограничения на организмы
Текст запроса: name:"histone"
Количество находок в Swiss-Prot: 2082
Общее количество находок: 154745
Поиск гистонов среди позвоночных
Текст запроса: name:"histone" taxonomy:"vertebrata"
Количество находок в Swiss-Prot: 717
Общее количество находок: 26350
Поиск гистонов среди инфузорий
Текст запроса: name:"histone" taxonomy:"ciliophora"
Количество находок в Swiss-Prot: 61
Общее количество находок: 491
Поиск трипсинов
Поиск по слову "трипсин"
Текст запроса: name:"trypsin"
Количество находок в Swiss-Prot: 312
Общее количество находок: 23018
Поиск трипсинов, исключая их ингибиторы
Текст запроса: name:"trypsin" and NOT name:"inhibitor"
Количество находок в Swiss-Prot: 101
Общее количество находок: 18270
Судя по результатам поиска, холинтриметиламинлиаза наиболее подробно изучена у Desulfovibrio alaskensis,
так как только у этого организма в целом отделе есть запись в Swiss-Prot.