Знакомство с Uniprot
В ходе данного практикума я познакомилась с устройством Uniprot[1] и нашла там некоторую информацию о выданном мне белке.
Получение информации о белке GCTA_ACIFV.
На сайте Uniprot в форму "Retrieve/ID mapping" был введен идентификатор белка. В таблице 1 представлена полученная информация о молярной массе, количестве аминокислотных остатков и о других характеристиках белка.[2]
UniProt ID | GCTA_ACIFV |
---|---|
UniProt AC | Q59111; D2RM71 |
RefSeq ID | WP_012939156.1 |
PDB ID | 1POI |
Длина белка (а.о.) | 320 |
Молекулярная масса (Да) | 35722 |
Рекомендуемое название | Glutaconate CoA-transferase subunit A |
Фермент трансфераза глютаконата-КоА, который относится к классу ферментов, катализирующих перенос группы КoA, и был выделен из анаэробной бактерии Acidaminococcus fermentans, превращает (P)-2-гидроксиглютарат в (P)-2-гидроксиглютарат-КоА. Фермент является гетерооктамером и состоит из субъединиц A и B, принадлежащих к классу α/β белков. Субъединица A состоит из повторяющихся α/β структур, в результате чего в центре образуется ядро из параллельных β-листов, окруженных α-спиралями.
Поиск белка GCTA_ACIFV в UniRef
Чтобы оценить распространенность и уникальность данного белка, была проведена серия поисков в UniRef100, UniRef90 и UniRef50. Найденная информация приведена в таблице 2.
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef100_Q59111 | Glutaconate CoA-transferase subunit A | 3 |
UniRef90 | UniRef90_Q59111 | Glutaconate CoA-transferase subunit A | 12 |
UniRef50 | UniRef50_Q59111 | Glutaconate CoA-transferase subunit A | 69 |
Стоит отметить, что кластер UniRef100 состоит из трех последовательностей, которые были получены из разных штаммов одной бактерии. Внутри кластера с 90% идентичностью находится уже 12 последовательностей из организмов, принадлежащих к одному роду. При самом низком пороге на сходство размер кластера составляет 69 последовательностей белка, выделенных из бактерий, которые в основном принадлежат одному отделу Firmicutes. Также для этого кластера характерен разброс в длине белков от 315 до 323 а.о.
Сеансы поиска в UniProt
Для ознакомления с синтаксисом в UniProt было проведено несколько сеансов поисков, представленных ниже.
Поиск трансферазы глютаконата-КоА
Поиск по рекомендованному полному названию
Текст запроса: 'name:"glutaconate coa transferase subunit a"'
Количество находок в Swiss-Prot: 1
Общее количество находок: 1035
Поиск по названию и организму
Текст запроса: 'name:"glutaconate coa transferase subunit a" organism:"acidaminococcus fermentans (strain ATCC 25085 / DSM 20731 / VR4)"'
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
Поиск по названию и семейству
Текст запроса: 'name:"glutaconate coa transferase subunit a" taxonomy:acidaminococcaceae'
Количество находок в Swiss-Prot: 1
Общее количество находок: 7
Поиск по названию и отделу
Текст запроса: 'name:"glutaconate coa transferase subunit a" taxonomy:firmicutes'
Количество находок в Swiss-Prot: 1
Общее количество находок: 101
Поиск гемоглобинов
Поиск гемоглобинов без ограничения на организмы
Текст запроса: name:hemoglobin
Количество находок в Swiss-Prot: 950
Общее количество находок: 20324
Поиск гемоглобинов у позвоночных
Текст запроса: name:hemoglobin taxonomy:vertebrata
Количество находок в Swiss-Prot: 825
Общее количество находок: 3418
Поиск гемоглобинов у инфузорий
Текст запроса: name:hemoglobin taxonomy:ciliophora
Количество находок в Swiss-Prot: 3
Общее количество находок: 21
Поиск трипсинов
Поиск по слову "трипсин"
Текст запроса: 'name:trypsin'
Количество находок в Swiss-Prot: 312
Общее количество находок: 23018
Поиск трипсинов, исключая их ингибиторы
Текст запроса: 'name:trypsin NOT name:inhibitor'
Количество находок в Swiss-Prot: 101
Общее количество находок: 18270
На данном примере хочется отметить, насколько мала база данных Swiss-Prot по сравнению с общим количеством данных. Также удивило наличие гемоглобина у некоторых представителей Сiliophora
Изучение истории изменений записи UniProt
История изменений данных о белке GCTA_ACIFV[3] достаточно велика и интересна. В 1996 году запись о белке впервые была добавлена в TrEMBL и только 1998 году - в Swiss-Prot. Тогда же был изменен ID белка, добавлены несколько функций, которые он выполняет, и изменено количество аминоксилотных остатков с 320 на 319. К 2010 году прежнее количество аминокислотных остатков было восстановлено, добавлено рекомендуемого название и исправлена систематика. Также стоит отметить, что была добавлена строка о достоверности белка и выяснена его структура. После этих изменений 18.05.2010 ID был изменен с GCTA_ACIFE на GCTA_ACIFV и добавлен новый AC. До 2019 году кардинальных замен замечено не было, не считая небольшого уточнения систематики.
Изучение ключей таблицы локальных особенностей
Так как в исследуемом белке в строках FT кроме описания структуры белка не было ничего интересного, то я решила изучить локальные особенности белка человека Prostaglandin E synthase.[4]Например, следующая строка: FT MUTAGEN 66 66 E->A: Reduces enzyme activity by 50% , означает, что при изменении аминокислоты с глутаминовой на аланин каталитическая активность фермента снижается в два раза. Другие строки показывают, что замена одной аминокислоты на другую может никак не влиять на активность(Y на F), слегка уменьшать его активность(R на A), или белок, вследствие этого, полностью теряет способность катализировать реакцию, как в случае замены тирозина на аланин.
Также интересна строка: CONFLICT 55 55 G -> GG (in Ref. 1; AAC39534).Она говорит о том, что разные исследователи получали разные последовательности. В данном случае вместо одного глицина на 55 а.о. в белке обнаружилось два.
Часто встречалось в FT: BINDING 117 117 Glutathione.Понятно, что 117 аминокислотный остаток является центром связывания для глутатиона.
Я была очень рада наконец-то разобраться в устройстве базы данных UniProt, так как в предыдущих практикумах работала с ней, но не понимала, что именно делаю. Также было очень интересно провести небольшое исследование о моем белке и больше узнать о нем.