Знакомство с Uniprot

В ходе данного практикума я познакомилась с устройством Uniprot[1] и нашла там некоторую информацию о выданном мне белке.

Получение информации о белке GCTA_ACIFV.

На сайте Uniprot в форму "Retrieve/ID mapping" был введен идентификатор белка. В таблице 1 представлена полученная информация о молярной массе, количестве аминокислотных остатков и о других характеристиках белка.[2]

Таблица 1.
Основная информация о белке GCTA_ACIFV из UniProt.
UniProt ID GCTA_ACIFV
UniProt AC Q59111; D2RM71
RefSeq ID WP_012939156.1
PDB ID 1POI
Длина белка (а.о.) 320
Молекулярная масса (Да) 35722
Рекомендуемое название Glutaconate CoA-transferase subunit A

Фермент трансфераза глютаконата-КоА, который относится к классу ферментов, катализирующих перенос группы КoA, и был выделен из анаэробной бактерии Acidaminococcus fermentans, превращает (P)-2-гидроксиглютарат в (P)-2-гидроксиглютарат-КоА. Фермент является гетерооктамером и состоит из субъединиц A и B, принадлежащих к классу α/β белков. Субъединица A состоит из повторяющихся α/β структур, в результате чего в центре образуется ядро из параллельных β-листов, окруженных α-спиралями.

Поиск белка GCTA_ACIFV в UniRef

Чтобы оценить распространенность и уникальность данного белка, была проведена серия поисков в UniRef100, UniRef90 и UniRef50. Найденная информация приведена в таблице 2.

Таблица 2.
Кластеры UniRef, содержащие белок GCTA_ACIFV.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_Q59111 Glutaconate CoA-transferase subunit A 3
UniRef90 UniRef90_Q59111 Glutaconate CoA-transferase subunit A 12
UniRef50 UniRef50_Q59111 Glutaconate CoA-transferase subunit A 69

Стоит отметить, что кластер UniRef100 состоит из трех последовательностей, которые были получены из разных штаммов одной бактерии. Внутри кластера с 90% идентичностью находится уже 12 последовательностей из организмов, принадлежащих к одному роду. При самом низком пороге на сходство размер кластера составляет 69 последовательностей белка, выделенных из бактерий, которые в основном принадлежат одному отделу Firmicutes. Также для этого кластера характерен разброс в длине белков от 315 до 323 а.о.

Сеансы поиска в UniProt

Для ознакомления с синтаксисом в UniProt было проведено несколько сеансов поисков, представленных ниже.

Поиск трансферазы глютаконата-КоА

Поиск гемоглобинов

Поиск трипсинов

На данном примере хочется отметить, насколько мала база данных Swiss-Prot по сравнению с общим количеством данных. Также удивило наличие гемоглобина у некоторых представителей Сiliophora

Изучение истории изменений записи UniProt

История изменений данных о белке GCTA_ACIFV[3] достаточно велика и интересна. В 1996 году запись о белке впервые была добавлена в TrEMBL и только 1998 году - в Swiss-Prot. Тогда же был изменен ID белка, добавлены несколько функций, которые он выполняет, и изменено количество аминоксилотных остатков с 320 на 319. К 2010 году прежнее количество аминокислотных остатков было восстановлено, добавлено рекомендуемого название и исправлена систематика. Также стоит отметить, что была добавлена строка о достоверности белка и выяснена его структура. После этих изменений 18.05.2010 ID был изменен с GCTA_ACIFE на GCTA_ACIFV и добавлен новый AC. До 2019 году кардинальных замен замечено не было, не считая небольшого уточнения систематики.

Изучение ключей таблицы локальных особенностей

Так как в исследуемом белке в строках FT кроме описания структуры белка не было ничего интересного, то я решила изучить локальные особенности белка человека Prostaglandin E synthase.[4]

Например, следующая строка: FT MUTAGEN 66 66 E->A: Reduces enzyme activity by 50% , означает, что при изменении аминокислоты с глутаминовой на аланин каталитическая активность фермента снижается в два раза. Другие строки показывают, что замена одной аминокислоты на другую может никак не влиять на активность(Y на F), слегка уменьшать его активность(R на A), или белок, вследствие этого, полностью теряет способность катализировать реакцию, как в случае замены тирозина на аланин.

Также интересна строка: CONFLICT 55 55 G -> GG (in Ref. 1; AAC39534).Она говорит о том, что разные исследователи получали разные последовательности. В данном случае вместо одного глицина на 55 а.о. в белке обнаружилось два.

Часто встречалось в FT: BINDING 117 117 Glutathione.Понятно, что 117 аминокислотный остаток является центром связывания для глутатиона.

Я была очень рада наконец-то разобраться в устройстве базы данных UniProt, так как в предыдущих практикумах работала с ней, но не понимала, что именно делаю. Также было очень интересно провести небольшое исследование о моем белке и больше узнать о нем.

Литература

[1]-UniProt

[2]-Страница с информацией о белке

[3]-История изменений

[4]