Знакомство с Uniprot
Основная цель практикума - ознакомиться с базой данных Uniprot, освоить основные методы работы с работой с ней.
Получение информации о белке LINB_SPHJU
В базе данных Uniprot была найдена информация о белке Haloalkane dehalogenase, который был получен из бактерии Sphingobium japonicum UT26. Полученная информация представлена в таблице 1:
UniProt ID | UniProt AC | RefSeq ID | PDB ID | Длина белка (а.о.) | Молекулярная масса (Да) | Рекомендуемое название |
---|---|---|---|---|---|---|
LINB_SPHJU | D4Z2G1; P51698 | WP_013040256.1 | 1CV2, 1D07, 1G42, 1G4H, 1G5F, 1IZ7, 1IZ8, 1K5P, 1K63, 1K6E, 1MJ5, 2BFN, 4WDQ, 4WDR, 5LKA | 296 AA | 33108 MW | Haloalkane dehalogenase |
Комментарий к таблице 1: Белок является мономером. Более подробную информацию о его структуре можно узнать в стетье "Purification and characterization of a haloalkane dehalogenase of a new substrate class from a gamma-hexachlorocyclohexane-degrading bacterium, Sphingomonas paucimobilis UT26." Белок был выделен из бактерии Sphingobium japonicum UT26, чей геном был впервые просеквенирован в 2010 году.
Поиск белка LINB_SPHJU в UniRef
По идентификатору белка был выполнен поиск в базе данных UniRef. Таким образом мы можем понять сколько существует белковых последовательностей, похожих друг на друга и на сколько процентов они совпадают. Всего есть три основных кластера схожести 100%, 90% и 50%. Также можно сделать вывод об изменении длин белковых последовательностей. Полученная информация представлена в таблице 2:
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef100_D4Z2G1 | Haloalkane dehalogenase | 6 |
UniRef90 | UniRef90_D4Z2G1 | Haloalkane dehalogenase | 53 |
UniRef50 | UniRef50_D4Z2G1 | Haloalkane dehalogenase | 760 |
Количество белков в кластере (При переходе от UniRef100 к Uniref50) резко растет. Отсюда можем предположить, что последовательность белка подвержена изменениям и не является консервативной. При этом длина последовательности остается неизменной (равна 296, по данным UniRef).
Сеансы поиска в UniProt
Для более детального знакомства с базой данных UniProt были проведены следующие сеансы поиска:
Поиск Галогеналкан-дегалогеназы:
-
Поиск по рекомендованному краткому названию:
Текст запроса: name: "1 4 tcdn halidohydrolase"
Количество находок в Swiss-Prot: 2
Общее количество находок: 2
-
Поиск по рекомендованному короткому названию среди своего организма:
Текст запроса: name: "1 4 tcdn halidohydrolase" AND organism:"Sphingobium japonicum (strain DSM 16413 / CCM 7287 / MTCC 6362 / UT26 / NBRC 101211 / UT26S) [452662]"
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
-
Поиск по краткому названию среди белков из организмов семейства Sphingomonadaceae:
Текст запроса: name: "1 4 tcdn halidohydrolase" AND taxonomy:"Sphingomonadaceae"
Количество находок в Swiss-Prot: 2
Общее количество находок: 2
-
Поиск по краткому названию среди белков из организмов отдела Proteobacteria:
Текст запроса: name: "1 4 tcdn halidohydrolase" AND taxonomy:"Proteobacteria"
Количество находок в Swiss-Prot: 2
Общее количество находок: 2
Поиск гистонов:
-
Поиск гистонов без ограничений по организмам:
Текст запроса: name:"Histone"
Количество находок в Swiss-Prot: 2082
Общее количество находок: 154745
-
Поиск гистонов среди таксона "Животные":
Текст запроса: name:"histone" and taxonomy:"metazoa"
Количество находок в Swiss-Prot: 1034
Общее количество находок: 72857
-
Поиск гистонов среди таксона "Позвоночные"
Текст запроса: name:"histone" and taxonomy:"vertebrata"
Количество находок в Swiss-Prot: 717
Общее количество находок: 25633
Поиск трипсинов:
-
Поиск по слову "трипсин":
Текст запроса: name:trypsin
Количество находок в Swiss-Prot: 312
Общее количество находок: 23012
-
Поиск трипсинов, исключая их ингибиторы:
Текст запроса: name:"trypsin" and NOT name:"inhibitor"
Количество находок в Swiss-Prot: 101
Общее количество находок: 18270
Данный поиск позволяет оценить число белков различных классов в разных группах организмов. Можем сделать вывод, что данный белок втречается редко.