Знакомство с UniProt

Практиктические задания выполнялись чтобы освоится с высокоиспользуемой базой Uniprot, знать какие есть возможности для поиска, в общем, облегчить себе жизнь в будущем

Получение информации о белке PSPA_HYDTT

В базу данных Uniprot был введен GeneBankID и найдена информация о Фосфосерин фо сфотазе из бактерии Hydrogenobacter thermophilus TK-6

. Полученная информация представлена в таблице 1

Таблица 1. Основная информация о белке PSPA_HYDTT из UniProt.
UniProt ID UniProt AC RefSeq ID PDB ID Длина белка (а.о.) Молекулярная масса (Да) Рекомендуемое название
PSPA_HYDTT D3DFG8 WP_012962753.1 4IJ5, 4IJ6 211 24556 Phosphoserine phosphatase 1 (PSP 1 or PSPase 1)

Комментарий к таблице 1. Белок дважды в разных работах был восстановлен по нуклеотидной последовательности ДНК (дважды секвенировали полный геном исследуемой бактерии). В работе 2013 года было проведено 2 кристаллографических анализа с разным разрешением (1.8А - 4IJ6 и 1.5А - 4IJ5). Белок являет гомодимером (есть 2 аналогичные цепочки)

Поиск белка PSPA_HYDTT в UniRef

Был проведен поиск в базе данных UniRef по идентификатору белка, чтобы понять, насколько белок распространен, сделать косвенные выводы о консервативности последоватеьности (если есть много белков внутри кластеров 100% и 90% - то можно предположит что белок важный и на аминокислотную последовательность действует стабилизирующий отбор).

Таблица 2. Кластеры UniRef, содержащие белок PSPA_HYDTT.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_D3DFG8 Phosphoserine phosphatase 1 (100%) 1
UniRef90 UniRef90_D3DFG8 Phosphoserine phosphatase 1 (90%) 3
UniRef50 UniRef50_D3DFG8 Phosphoserine phosphatase 1 (50%) 8

Заметим, что даже для очень низкого порога на сходство в кластере всего 8 белков, что очень кажется мало. Значит последовательность не очень консервативная и мало в каких еще организмах этот белок есть. Бактерия-хозяин и правда высокоспецифичный экстремофил с необычным метаболизмом, поэтому белок видимо действительно специфичен для группы (все 8 белков изкластера на 50% - из бактерий той же группы). Плюс порядок ее мало исследован - например, в базе NCBI всего 31 полностью собранный геном для всего порядка (вообще, может это и не мало для бактерий, но тем не менее), поэтому сложно расуждать о распространнености фермента внутри группы.

Сеансы поиска в UniProt

Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска, представленные ниже. >

Поиск Фосфатазы фосфосерина

Поиск цитохромов

Поиск трипсинов

Aquificae - бактерии-экстремофилы, объединенные на основании того, что они все могут окислять водород с образованием воды. Фосфосерин фосфатаза катализирует промежуточную реакцию в синтезе глицина из 3-фосфоглицерата (продукт гликолиза). Эта реакция вообще-то общая для многих организмов, что косвенно можно увидеть из количества результатов по поиску обычной фосфатазы. Особенность этого фермента в то, что он не нуждается в присутствии Mg в среде. (возможно, приспособление высокоспециализированного семейства экстремофилов к жизни в бедных почвах). Вероятно поэтому аналогов у фермента мало.
Цитохромы учавствуют в переносе электронов в дыхательной цепи. Это короткий и высококонсервативный белок, и очень широко распространен. Не удивительно, что поиск выдает столь много результатов по данному запросу!
Интересно, что при применении фильтра количество не аннотированных последовательностей уменьшилось процентов на 20, а аннотированных - в три раза! Значит в принципе известных последовательностей белка - примерно в 4 раза больше чем последовательностей различных его ингибиторов, но исследователям интересно аккуратно подходить к изучению и вообще много исследовать именно ингибиторы. Во-первых наверное потому, что сам трипсин не сильно различен от организма к организму, в отличии от ингибиторов, которых наверняка очень много разных. Во-вторых, исследование ингибиторов актуальная проблема в связи с заинтересованностью в здоровье людей и работы важного в пищеварении фермента.

Изучение ключей таблицы локальных особенностей (Feature Table)

Для того, чтобы разобраться, какая строчка что означает, был использован сайт https://web.expasy.org/docs/userman.html. Был рассмотрен изначальный белок, но в нем не было ниего интересного Поэтому чтобы посмотреть, как представлено фосфорилирование в FT строчках был взят белок, найденный в базе по запросу "annotation:(type:ptm phosphorylation)" На глаза попался белок PSBA_MAIZE - Photosystem II protein D1 из кукурузы.

В исследуемом на страничке белке мало интересных известных особеностей:

Далее решилось что интересно посмотретьна фосфорилирование:

Итого, по строчкам FT на самом деле можно многое узнать о строении и функциях белка.