Задание 1. Описание фенилацетат-коэнзим А лигазы из генома бактерии Bacteroides Thetaiotaomicron
Информация о белке в базе данных UniProt
UniProt ID | Q8AAN6_BACTN |
UniProt AC (Acession numder) | Q8AAN6 |
RefSeq ID | NP_809341.1 (устаревшее); WP_008760705.1 (новое) |
PDB ID | 4R1L; 4R1M; 4RVN; 4RVO |
Длина | 435 AA |
Молекуларная масса (MW) | 49380 |
Рекомендуемое UniProt название (DE: Recname Full) | Phenylacetate-coenzyme A ligase |
Статус | Unrewied |
Дополнительная информация из UniProt
- Структура известна для всего белка.
- Существование белка подтверждают экспериментальные данные.
- В PDB файлах структура представлена 4 цепями.
- Альтернативное название белка (DE: AltName Full): Phenylacetyl-CoA ligase.
- Белок принадлежит бактерии Bacteroides Thetaiotaomicron, которая относится к следующему таксономическому ряду (OC):
Bacteria; Bacteroidetes; Bacteroidia; Bacteroidales; Bacteroidaceae; Bacteroides.
- Первая публикация - 01-JUN-2003, дата последнего редактирования - 13-APR-2016.
- Идентификатор RefSeq нуклеотидной последовательности - NC_004663.1.
- Функция белка: катализирует активацию превращения фенилуксусной кислоты в фенилацетил КоА.
- ORF (Ordered locus name): BT_0428. Название, используемое для представления открытой рамки считываения в полностью отсеквенированном
геноме или хромосоме.
Задание 2. Кластеры UniProt для исследуемого белка
Кластер | Идентификатор кластера | Название кластера | Описание кластера | Количество белков | Примеры организмов-источников
белков кластера |
Uniref100 | UniRef100_C6IET0 | Cluster: Phenylacetate-coenzyme A ligase | В Uniref100 все идентичные последовательности и субфрагменты с 11 и более остатками
помещены в одну запись. | 6 | Bacteroides sp. 1_1_6; Bacteroides faecis CAG:32; Bacteroides thetaiotaomicron CAG:40. |
Uniref90 | UniRef90_E1WU78 | Cluster: Phenylacetate-coenzyme A ligase | Uniref90 объединяет последовательности идентичные >=90% и перекрывающиеся с самой длинной
последовательностью в кластере на 80%. | 119 | Bacteroides sp. D2; Bacteroides fragilis str. 3725 D9 ii; Bacteroides ovatus CL03T12C18; Bacteroides ovatus str. 3725 D1 iv;
Bacteroides ovatus 3_8_47FAA. |
Uniref50 | UniRef50_E1WU78 | Cluster: Phenylacetate-coenzyme A ligase | Uniref50 включает последовательности, на
80% перекрывающиеся с самой длинной последовательностью и отличающиеся не более, чем на 50%. | 190 | Bacteroides fragilis (strain 638R); Bacteroides sp. CAG:633;
Bacteroides fragilis; Bacteroides sp. 1_1_6; Bacteroides thetaiotaomicron. |
Задание 3. Результаты сеансов поиска в UniProt
- Поиск по рекомендованному названию белка.
Поисковый запрос: name:"phenylacetate coenzyme a" name:ligase.
Результаты: нашлось 3420 белков, только 4 из них имеют рецензию Swiss-Prot.
- Поиск по названию среди семейства.
Поисковый запрос: name:"phenylacetate coenzyme a" name:ligase taxonimy:Bacteroidaceae.
Результаты: все 283 найденных белка со статусом "Unreviewed".
- Поиск по названию среди отдела.
Поисковый запрос: name:"phenylacetate coenzyme a" name:ligase taxonomy:bacteroidetes
Результаты: нашлось 420 белков, ни один из которых не рцензирован Swiss-Prot.
- Поиск по названию "actin" в разных таксонах.
а) Поисковый запрос: name:actin.
Результаты: найдено 45468 записей, где 1119 принадлежат банку данных Swiss-Prot.
б) Поисковый запрос: name:actin taxonomy:arthropoda.
Результаты: найдено 4925 белков, из которых 59 имеют статус "Reviewed".
в) Поисковый запрос: name:actin taxonomy:vertebrata.
Результаты: нашлось 8243 белка, в их числе 491 белок из базы данных Swiss-Prot.
- Поиск по названию "trypsin" vs. "trypsin inhibitor".
а) Поисковый запрос: name:trypsin.
Результаты: найдено 11309 белков, из них 301 "Reviewed".
б) Поисковый запрос: name:trypsin name:inhibitor.
Результаты: нашлось 2558 записей, из них 203 имеют рецензию Swiss-Prot.
Дополнительные задания
4. RefSeq/Uniprot - различия.
Очевидно, что запись RefSeq даёт гораздо меньше информации, чем подробная запись в UniProt. В ней нет ссылок на другие
базы данных и PDB файлы, не прописаны физико-химические свойства, функции, отсутствуют ссылки на научные работы, где исследуется данный белок. Однако так же, как и в Uniprot,
в RefSeq можно найти информацию о таксономическом положении организма, ознакомиться с кратким комментарием к последовательности, узнать о сайтах связывания с лигандами.
5. История изменений записи UniProt.
C момента публикации записи о исследуемом мной белке (1 июня 2003 года) было произведено 90 редактирований записи.
Последнее было совершено относительно недавно - 13 апреля 2016 года. Сравнение первой и последней версии показало, что 20 строк было удалено, а добавлено 192 строки,
сама последовательность не изменялась.
6. Гликозилирование в UniProt.
В разделе пострансляционных модификаций (PTM/processing) может быть найдена информация по гликозилированию. В текстовом файле
она обозначается CARBOHYD в строке FT (Feature table). Запись точно устанавливает позицию и тип каждой ковалентно связанной гликановой группой (моно-, ди- и полисахарида).
Типы гликозилирования зависят от атома аминокислоты, который непосредственной связывается с углеводной цепью, то есть возможны С-linked, N-linked и O-linked типы. Примеры
моносахаридов: P54939, P13671. Полисахариды - Q15293, P46976, Q9S8M0. Если данных по гликозилированию не хватает, то информация загружается в подсекцию "Post-translational
modification".
Источники:
[1] UniProt Knowledgebase
[2] NCBI Taxonomy
|