Описание белка NP_809341.1 в базе данных UniProt

Задание 1. Описание фенилацетат-коэнзим А лигазы из генома бактерии Bacteroides Thetaiotaomicron

Информация о белке в базе данных UniProt
UniProt IDQ8AAN6_BACTN
UniProt AC (Acession numder)Q8AAN6
RefSeq IDNP_809341.1 (устаревшее); WP_008760705.1 (новое)
PDB ID4R1L; 4R1M; 4RVN; 4RVO
Длина435 AA
Молекуларная масса (MW)49380
Рекомендуемое UniProt название (DE: Recname Full)Phenylacetate-coenzyme A ligase
СтатусUnrewied

Дополнительная информация из UniProt

  • Структура известна для всего белка.
  • Существование белка подтверждают экспериментальные данные.
  • В PDB файлах структура представлена 4 цепями.
  • Альтернативное название белка (DE: AltName Full): Phenylacetyl-CoA ligase.
  • Белок принадлежит бактерии Bacteroides Thetaiotaomicron, которая относится к следующему таксономическому ряду (OC): Bacteria; Bacteroidetes; Bacteroidia; Bacteroidales; Bacteroidaceae; Bacteroides.
  • Первая публикация - 01-JUN-2003, дата последнего редактирования - 13-APR-2016.
  • Идентификатор RefSeq нуклеотидной последовательности - NC_004663.1.
  • Функция белка: катализирует активацию превращения фенилуксусной кислоты в фенилацетил КоА.
  • ORF (Ordered locus name): BT_0428. Название, используемое для представления открытой рамки считываения в полностью отсеквенированном геноме или хромосоме.

Задание 2. Кластеры UniProt для исследуемого белка

КластерИдентификатор кластераНазвание кластераОписание кластераКоличество белковПримеры организмов-источников белков кластера
Uniref100UniRef100_C6IET0Cluster: Phenylacetate-coenzyme A ligaseВ Uniref100 все идентичные последовательности и субфрагменты с 11 и более остатками помещены в одну запись.6Bacteroides sp. 1_1_6; Bacteroides faecis CAG:32; Bacteroides thetaiotaomicron CAG:40.
Uniref90UniRef90_E1WU78Cluster: Phenylacetate-coenzyme A ligaseUniref90 объединяет последовательности идентичные >=90% и перекрывающиеся с самой длинной последовательностью в кластере на 80%.119Bacteroides sp. D2; Bacteroides fragilis str. 3725 D9 ii; Bacteroides ovatus CL03T12C18; Bacteroides ovatus str. 3725 D1 iv; Bacteroides ovatus 3_8_47FAA.
Uniref50UniRef50_E1WU78Cluster: Phenylacetate-coenzyme A ligaseUniref50 включает последовательности, на 80% перекрывающиеся с самой длинной последовательностью и отличающиеся не более, чем на 50%.190Bacteroides fragilis (strain 638R); Bacteroides sp. CAG:633; Bacteroides fragilis; Bacteroides sp. 1_1_6; Bacteroides thetaiotaomicron.

Задание 3. Результаты сеансов поиска в UniProt

  • Поиск по рекомендованному названию белка.
    Поисковый запрос: name:"phenylacetate coenzyme a" name:ligase.
    Результаты: нашлось 3420 белков, только 4 из них имеют рецензию Swiss-Prot.
  • Поиск по названию среди семейства.
    Поисковый запрос: name:"phenylacetate coenzyme a" name:ligase taxonimy:Bacteroidaceae.
    Результаты: все 283 найденных белка со статусом "Unreviewed".
  • Поиск по названию среди отдела.
    Поисковый запрос: name:"phenylacetate coenzyme a" name:ligase taxonomy:bacteroidetes
    Результаты: нашлось 420 белков, ни один из которых не рцензирован Swiss-Prot.
  • Поиск по названию "actin" в разных таксонах.
    а) Поисковый запрос: name:actin.
    Результаты: найдено 45468 записей, где 1119 принадлежат банку данных Swiss-Prot.
    б) Поисковый запрос: name:actin taxonomy:arthropoda.
    Результаты: найдено 4925 белков, из которых 59 имеют статус "Reviewed".
    в) Поисковый запрос: name:actin taxonomy:vertebrata.
    Результаты: нашлось 8243 белка, в их числе 491 белок из базы данных Swiss-Prot.
  • Поиск по названию "trypsin" vs. "trypsin inhibitor".
    а) Поисковый запрос: name:trypsin.
    Результаты: найдено 11309 белков, из них 301 "Reviewed".
    б) Поисковый запрос: name:trypsin name:inhibitor.
    Результаты: нашлось 2558 записей, из них 203 имеют рецензию Swiss-Prot.

Дополнительные задания

4. RefSeq/Uniprot - различия.

Очевидно, что запись RefSeq даёт гораздо меньше информации, чем подробная запись в UniProt. В ней нет ссылок на другие базы данных и PDB файлы, не прописаны физико-химические свойства, функции, отсутствуют ссылки на научные работы, где исследуется данный белок. Однако так же, как и в Uniprot, в RefSeq можно найти информацию о таксономическом положении организма, ознакомиться с кратким комментарием к последовательности, узнать о сайтах связывания с лигандами.

5. История изменений записи UniProt.

C момента публикации записи о исследуемом мной белке (1 июня 2003 года) было произведено 90 редактирований записи. Последнее было совершено относительно недавно - 13 апреля 2016 года. Сравнение первой и последней версии показало, что 20 строк было удалено, а добавлено 192 строки, сама последовательность не изменялась.

6. Гликозилирование в UniProt.

В разделе пострансляционных модификаций (PTM/processing) может быть найдена информация по гликозилированию. В текстовом файле она обозначается CARBOHYD в строке FT (Feature table). Запись точно устанавливает позицию и тип каждой ковалентно связанной гликановой группой (моно-, ди- и полисахарида). Типы гликозилирования зависят от атома аминокислоты, который непосредственной связывается с углеводной цепью, то есть возможны С-linked, N-linked и O-linked типы. Примеры моносахаридов: P54939, P13671. Полисахариды - Q15293, P46976, Q9S8M0. Если данных по гликозилированию не хватает, то информация загружается в подсекцию "Post-translational modification".


Источники:

[1] UniProt Knowledgebase
[2] NCBI Taxonomy

© Marina Gladkova, 2016