Знакомство с UniProt
Практиктические задания выполнялись чтобы освоится с высокоиспользуемой базой Uniprot, знать какие есть возможности для поиска, в общем, облегчить себе жизнь в будущем
Получение информации о белке PSPA_HYDTT
В базу данных Uniprot был введен GeneBankID и найдена информация о Фосфосерин фо
сфотазе из бактерии Hydrogenobacter thermophilus TK-6
.
Полученная информация представлена в таблице 1
UniProt ID | UniProt AC | RefSeq ID | PDB ID | Длина белка (а.о.) | Молекулярная масса (Да) | Рекомендуемое название |
---|---|---|---|---|---|---|
PSPA_HYDTT | D3DFG8 | WP_012962753.1 | 4IJ5, 4IJ6 | 211 | 24556 | Phosphoserine phosphatase 1 (PSP 1 or PSPase 1) |
Комментарий к таблице 1. Белок дважды в разных работах был восстановлен по нуклеотидной последовательности ДНК (дважды секвенировали полный геном исследуемой бактерии). В работе 2013 года было проведено 2 кристаллографических анализа с разным разрешением (1.8А - 4IJ6 и 1.5А - 4IJ5). Белок являет гомодимером (есть 2 аналогичные цепочки)
Поиск белка PSPA_HYDTT в UniRef
Был проведен поиск в базе данных UniRef по идентификатору белка, чтобы понять, насколько белок распространен, сделать косвенные выводы о консервативности последоватеьности (если есть много белков внутри кластеров 100% и 90% - то можно предположит что белок важный и на аминокислотную последовательность действует стабилизирующий отбор).
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef100_D3DFG8 | Phosphoserine phosphatase 1 (100%) | 1 |
UniRef90 | UniRef90_D3DFG8 | Phosphoserine phosphatase 1 (90%) | 3 |
UniRef50 | UniRef50_D3DFG8 | Phosphoserine phosphatase 1 (50%) | 8 |
Заметим, что даже для очень низкого порога на сходство в кластере всего 8 белков, что очень кажется мало. Значит последовательность не очень консервативная и мало в каких еще организмах этот белок есть. Бактерия-хозяин и правда высокоспецифичный экстремофил с необычным метаболизмом, поэтому белок видимо действительно специфичен для группы (все 8 белков изкластера на 50% - из бактерий той же группы). Плюс порядок ее мало исследован - например, в базе NCBI всего 31 полностью собранный геном для всего порядка (вообще, может это и не мало для бактерий, но тем не менее), поэтому сложно расуждать о распространнености фермента внутри группы.
Сеансы поиска в UniProt
Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска, представленные ниже. >
Поиск Фосфатазы фосфосерина
Поиск фосфатазы по рекомендованному краткому названию
Текст запроса: name:"psp 1"
Количество находок в Swiss-Prot: 2
Общее количество находок: 3086
Поиск фосфатазы по рекомендованному длинному названию
Текст запроса: name:"Phosphoserine phosphatase 1"
Количество находок в Swiss-Prot: 1
Общее количество находок: 822
Поиск фосфатазы
Текст запроса: name:"phosphoserine phosphatase" NOT name:inhibitor
Количество находок в Swiss-Prot: 38
Общее количество находок: 30,132
Поиск фосфатазы по краткому названию среди белков бактерии Hydrogenobacter thermophilus TK-6
Текст запроса: name:"psp 1" AND organism:"Hydrogenobacter thermophilus (strain DSM 6534 / IAM 12695 / TK-6) [608538]"
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
Поиск по краткому названию среди белков из организмов семейства Aquificaceae
Текст запроса: name:"psp 1" taxonomy:"Aquificaceae [64898]"
Количество находок в Swiss-Prot: 1
Общее количество находок: 6
Поиск по краткому названию среди белков из организмов отдела Aquificae
Текст запроса: name:"psp 1" taxonomy:"Aquificae [200783]"
Количество находок в Swiss-Prot: 1
Общее количество находок: 15
Поиск цитохромов
Поиск цитохромов без ограничения на организмы
Текст запроса: name:cytochrome
Количество находок в Swiss-Prot: 7,713
Общее количество находок: 2,578,674
Поиск цитохромов в Грибах
Текст запроса: name:cytochrome taxonomy:"Fungi [4751]"
Количество находок в Swiss-Prot: 695
Общее количество находок: 58,554
Поиск цитохромов Инфузориях
Текст запроса: name:cytochrome taxonomy:"Ciliophora [5878]"
Количество находок в Swiss-Prot: 6
Общее количество находок: 1,918
Поиск трипсинов
Поиск по слову "трипсин"
Текст запроса: name:trypsin
Количество находок в Swiss-Prot: 312
Общее количество находок: 23,018
Поиск трипсинов, исключая их ингибиторы
Текст запроса: name:trypsin NOT name:inhibitor
Количество находок в Swiss-Prot: 101
Общее количество находок: 18,270
Aquificae - бактерии-экстремофилы, объединенные на основании того, что они все могут окислять водород с образованием воды.
Фосфосерин фосфатаза катализирует промежуточную реакцию в синтезе глицина из 3-фосфоглицерата (продукт гликолиза). Эта реакция вообще-то общая для многих организмов,
что косвенно можно увидеть из количества результатов по поиску обычной фосфатазы. Особенность этого фермента в то, что он не нуждается в присутствии Mg в среде.
(возможно, приспособление высокоспециализированного семейства экстремофилов к жизни в бедных почвах). Вероятно поэтому аналогов у фермента мало.
Цитохромы учавствуют в переносе электронов в дыхательной цепи. Это короткий и высококонсервативный белок, и очень широко распространен.
Не удивительно, что поиск выдает столь много результатов по данному запросу!
Интересно, что при применении фильтра количество не аннотированных последовательностей уменьшилось процентов на 20,
а аннотированных - в три раза! Значит в принципе известных последовательностей белка - примерно в 4 раза больше чем последовательностей различных его ингибиторов,
но исследователям интересно аккуратно подходить к изучению и вообще много исследовать именно ингибиторы. Во-первых наверное потому, что сам трипсин не сильно
различен от организма к организму, в отличии от ингибиторов, которых наверняка очень много разных. Во-вторых, исследование ингибиторов актуальная проблема в связи
с заинтересованностью в здоровье людей и работы важного в пищеварении фермента.
Изучение ключей таблицы локальных особенностей (Feature Table)
Для того, чтобы разобраться, какая строчка что означает, был использован сайт https://web.expasy.org/docs/userman.html. Был рассмотрен изначальный белок, но в нем не было ниего интересного Поэтому чтобы посмотреть, как представлено фосфорилирование в FT строчках был взят белок, найденный в базе по запросу "annotation:(type:ptm phosphorylation)" На глаза попался белок PSBA_MAIZE - Photosystem II protein D1 из кукурузы.
В исследуемом на страничке белке мало интересных известных особеностей:
- "ACT_SITE 9 9 Tele-phosphohistidine intermediate." то есть 9 аминокислота (которая по послеовательности гистидин и есть) довольно интеерсно фосфорилируется в более дальнем от С-цепи азоте (см https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3263764/bin/nihms343613f1.jpg). И это нужно для активности фермента
- Заметим, что сайтов связывания METAL нет, что соответствует описанию данного фермента как не требующего присутствия Mg в среде
- Во-первых в строчках СС есть запись:
CC -!- PTM: Phosphorylated in both bundle sheath and mesophyll cells,
CC phosphorylation increases when cells are grown under high rather
CC than low light regimes (70 vs 900 umol photons/m-2/s).
Из которой мы узнаем, что фосфорилирование происходит и в клетках обкладки, и в клетках мезофилла (у кукурузы кранц-анатомия), и фосфорилирование увеличивается в условиях низкого освещения - Также в строчках FT есть запись:
FT MOD_RES 2 2 Phosphothreonine. {ECO:0000255|HAMAP-
FT Rule:MF_01379,
FT ECO:0000269|PubMed:22833285}.
Откуда мы узнаем, что фосфорилируется остаток треонина (и в последова тельности на 2ом месте действительно стоит Т - треонин)
Итого, по строчкам FT на самом деле можно многое узнать о строении и функциях белка.