Знакомство с Uniprot.
Работа над данным практикумом позволила освоить навыки использования базы данных UniProt, необходимые для для эффективного получения информации о биомолекулах.
Получение информации о белке 5'-нуклеотидазе SurE.
Из записи о белке в формате UniProt были получены данные о белке. Полученная информация представлена в таблице 1.
UniProt ID | SURE_XYLFA |
---|---|
UniProt AC | Q9PF20 |
Название белка | Nucleoside 5'-monophosphate phosphohydrolase |
RefSeq ID | WP_010893378.1 |
PDB ID | 5KSQ, 5KSR, 5KSS, 5KST |
Длина белка (а.о.) | 262 |
Молекулярная масса (Да) | 28391 |
Рекомендуемое название | 5'-nucleotidase SurE |
Способом рентгено-структурного анализа было получено 4 структуры белка в формате PDB. Для данного белка известн о4 цепи (A, B, C, D)
Поиск белка SURE_XYLFA в UniRef.
Данные о кластерах, содержащих белок Q9PF20, были получены поиском по базе данных UniRef в составе UniProt. Данные об ID, названиях и размерах кластеров приведены в таблице 2.
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef100_Q9PF20 | 5'-nucleotidase SurE | 4 |
UniRef90 | UniRef90_Q9PF20 | 5'-nucleotidase SurE | 18 |
UniRef50 | UniRef50_Q9PF20 | 5'-nucleotidase SurE | 99 |
Для UniRef100_Q9PF20 было обнаружено 4 белка, все они принадлежат бактерии Xylella fastidiosa, но только два из них одному штамму 9a5c. В кластере UniRef90_Q07982 все 18 белков также принадлежат разным штаммам одного вида Xylella fastidiosa. В кластере UniRef50_Q9PF20 находится 99 белков из разных бактерий не только рода Xylella (14), но и других таксонов типа Протеобактерий.
Сеансы поиска в UniProt.
Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска.
Поиск 5'-нуклеотидазы SurE
-
Поиск в UniProt по рекомендованному названию белка
Текст запроса: "5'-nucleotidase SurE"
Количество находок в Swiss-Prot: 63
Общее количество находок: 3108
-
Поиск по рекомендованному названию белка среди белков данного организма
Текст запроса: "taxonomy:"xylella fastidiosa" name:"5 prime nucleotidase sure""
Количество находок в Swiss-Prot: 4
Общее количество находок: 13
-
Поиск по рекомендованному названию белка среди огранизмов семейства, к которому принадлежит данный организм
Текст запроса: "name:"5 prime nucleotidase sure" taxonomy:xanthomonadaceae"
Количество находок в Swiss-Prot: 14
Общее количество находок: 267
-
Поиск по тому же названию среди белков из организмов того же отдела
Текст запроса: "name:"5 prime nucleotidase sure" taxonomy:xanthomonadales"
Количество находок в Swiss-Prot: 14
Общее количество находок: 336
Поиск цитохромов
-
Поиск цитохромов без ограничения на организмы
Текст запроса: "name:cytochrome"
Количество находок в Swiss-Prot: 7,713
Общее количество находок: 2,578,674
-
Поиск цитохромов с ограничением на подтип позвоночных (Vertebrata)
Текст запроса: "name:cytochrome taxonomy:vertebrata"
Количество находок в Swiss-Prot: 2,938
Общее количество находок: 317,449
-
Поиск цитохромов с ограничением на класс бурых водорослей (Phaeophyceae)
Текст запроса: "name:cytochrome taxonomy:phaeophyceae"
Количество находок в Swiss-Prot: 3
Общее количество находок: 3,300
Поиск трипсинов
-
Поиск по слову "трипсин"
Текст запроса: "name:trypsin"
Количество находок в Swiss-Prot: 312
Общее количество находок: 23,018
-
Поиск трипсинов, исключая их ингибиторы
Текст запроса: "name:trypsin NOT name:inhibitor"
Количество находок в Swiss-Prot: 101
Общее количество находок: 18,270
Из результатов поиска в UniProt задания ясно видно, что чем меньше таксон для поиска белка, тем меньше подходящих записей удается найти,
что логично, и, соответственно, чем меньше фильтров при поиске, тем больше результатов.
Кроме того, было обнаружено, что наиболее популярным из всех исследуемых в практикуме биомолекул является цитохром.
Он активно изучается не только на человеке и других млекопитающих, но и на многих одноклеточных организмах.
Вывод
В ходе практикума были освоены основы работы с базами данных на примере UniProt. Были изучены структуры записи данных о биомолекуле, кластеров и работа с фильтрами поиска.