Euzebya pacifica DY32-46 UP000264006
Для бактерии Euzebya pacifica DY32-46 была найдена геномная сборка в базе NCBI:
| Параметр | Значение |
|---|---|
| Ссылка на страницу сборки в NCBI Datasets Genome | https://www.ncbi.nlm.nih.gov/datasets/genome/GCF_003344865.1/ |
| RefSeq ID | GCF_003344865.1 |
| INSDC ID (GenBank) | GCA_003344865.1 |
Поисковый запрос в UniProt Proteomes:
(genome_assembly:GCA_003344865.1)
Результаты поиска:
| Параметр | Значение |
|---|---|
| Идентификатор протеома (UPID) | UP000264006 |
| Статус протеома | Reference proteome (эталонный) |
| Количество записей в UniProtKB | 5 625 |
Так как для Euzebya pacifica существует референсный протеом (UP000264006), дальнейший поиск не потребовался. Использован TaxID: 1608957.
Поисковый запрос для проверки:
(taxonomy_id:1608957) AND (proteome_type:1)
Для анализа использовался конвейер команд bash. Аннотации извлекались из полей FT HELIX и FT TRANSMEM.
Результаты:
| Показатель | Значение |
|---|---|
| Всего белков в протеоме | 5 625 |
| Белки с аннотацией HELIX | 0 (0.00%) |
| Белки с аннотацией TRANSMEM | 0 (0.00%) |
| Белки с обоими типами | 0 (0.00%) |
Протеом UP000264006 относится к категории автоматически аннотированных (TrEMBL). Аннотации вторичной структуры (HELIX) добавляются только при наличии экспериментально определённой трёхмерной структуры белка в базе PDB. Для Euzebya pacifica такие данные на данный момент отсутствуют.
Аннотации трансмембранных участков (TRANSMEM) также не были добавлены в данный протеом. Это демонстрирует важную особенность работы с автоматически аннотированными протеомами: не все типы аннотаций присутствуют.
Для оценки количества ферментов использованы два подхода: поиск по полю Enzyme Commission number и поиск по ключевым словам.
Запрос 1 (по полю EC):
(proteome:UP000264006) AND (ec:*)
Запрос 2 (по ключевым словам):
(proteome:UP000264006) AND (keyword:enzyme OR keyword:hydrolase OR keyword:transferase OR keyword:oxidoreductase OR keyword:lyase OR keyword:isomerase OR keyword:ligase)
Результаты:
| Метод оценки | Количество белков | Доля от общего числа (5 625) |
|---|---|---|
| По полю EC (строгий метод) | 754 | 13.4% |
| По ключевым словам (расширенный метод) | 1 691 | 30.1% |
Реалистичная оценка доли ферментов в протеоме Euzebya pacifica находится между этими двумя значениями. Для бактерий типичная доля ферментов составляет 30-50% от всех белков, что делает оценку по ключевым словам (30.1%) более реалистичной.
В ходе выполнения практикума №8 были решены следующие задачи:
UP000264006, соответствующий геномной сборке Euzebya pacifica DY32-46.