Практикум 3 (5)

Знакомство с Uniprot.

Работа над данным практикумом позволила освоить навыки использования базы данных UniProt, необходимые для для эффективного получения информации о биомолекулах.

Получение информации о белке 5'-нуклеотидазе SurE.

Из записи о белке в формате UniProt были получены данные о белке. Полученная информация представлена в таблице 1.

Таблица 1. Основная информация о белке SURE_XYLFA из UniProt.
UniProt ID SURE_XYLFA
UniProt AC Q9PF20
Название белка Nucleoside 5'-monophosphate phosphohydrolase
RefSeq ID WP_010893378.1
PDB ID 5KSQ, 5KSR, 5KSS, 5KST
Длина белка (а.о.) 262
Молекулярная масса (Да) 28391
Рекомендуемое название 5'-nucleotidase SurE

Способом рентгено-структурного анализа было получено 4 структуры белка в формате PDB. Для данного белка известн о4 цепи (A, B, C, D)

Поиск белка SURE_XYLFA в UniRef.

Данные о кластерах, содержащих белок Q9PF20, были получены поиском по базе данных UniRef в составе UniProt. Данные об ID, названиях и размерах кластеров приведены в таблице 2.

uniRef clusters
Таблица 2. Кластеры UniRef, содержащие белок SURE_XYLFA.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_Q9PF20 5'-nucleotidase SurE 4
UniRef90 UniRef90_Q9PF20 5'-nucleotidase SurE 18
UniRef50 UniRef50_Q9PF20 5'-nucleotidase SurE 99

Для UniRef100_Q9PF20 было обнаружено 4 белка, все они принадлежат бактерии Xylella fastidiosa, но только два из них одному штамму 9a5c. В кластере UniRef90_Q07982 все 18 белков также принадлежат разным штаммам одного вида Xylella fastidiosa. В кластере UniRef50_Q9PF20 находится 99 белков из разных бактерий не только рода Xylella (14), но и других таксонов типа Протеобактерий.

Сеансы поиска в UniProt.

Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска.

Поиск 5'-нуклеотидазы SurE

Поиск цитохромов

Поиск трипсинов

Из результатов поиска в UniProt задания ясно видно, что чем меньше таксон для поиска белка, тем меньше подходящих записей удается найти, что логично, и, соответственно, чем меньше фильтров при поиске, тем больше результатов.
Кроме того, было обнаружено, что наиболее популярным из всех исследуемых в практикуме биомолекул является цитохром. Он активно изучается не только на человеке и других млекопитающих, но и на многих одноклеточных организмах.

Вывод

В ходе практикума были освоены основы работы с базами данных на примере UniProt. Были изучены структуры записи данных о биомолекуле, кластеров и работа с фильтрами поиска.