← Назад к списку работ

Практикум №8: Работа с протеомами

Euzebya pacifica DY32-46 UP000264006

1. Поиск протеома, соответствующего геномной сборке

Для бактерии Euzebya pacifica DY32-46 была найдена геномная сборка в базе NCBI:

ПараметрЗначение
Ссылка на страницу сборки в NCBI Datasets Genomehttps://www.ncbi.nlm.nih.gov/datasets/genome/GCF_003344865.1/
RefSeq IDGCF_003344865.1
INSDC ID (GenBank)GCA_003344865.1

Поисковый запрос в UniProt Proteomes:

(genome_assembly:GCA_003344865.1)

Результаты поиска:

ПараметрЗначение
Идентификатор протеома (UPID)UP000264006
Статус протеомаReference proteome (эталонный)
Количество записей в UniProtKB5 625
Примечание: Протеом не является избыточным (redundant) и не был удалён. Он состоит из хромосомы (CP031165, 5 038 белков) и плазмиды pEDY32-46I (CP031166, 587 белков).

2. Поиск и скачивание референсного протеома

Так как для Euzebya pacifica существует референсный протеом (UP000264006), дальнейший поиск не потребовался. Использован TaxID: 1608957.

Поисковый запрос для проверки:

(taxonomy_id:1608957) AND (proteome_type:1)

3. Оценка числа белков, содержащих альфа-спирали

Для анализа использовался конвейер команд bash. Аннотации извлекались из полей FT HELIX и FT TRANSMEM.

Результаты:

ПоказательЗначение
Всего белков в протеоме5 625
Белки с аннотацией HELIX0 (0.00%)
Белки с аннотацией TRANSMEM0 (0.00%)
Белки с обоими типами0 (0.00%)
Объяснение результатов:

Протеом UP000264006 относится к категории автоматически аннотированных (TrEMBL). Аннотации вторичной структуры (HELIX) добавляются только при наличии экспериментально определённой трёхмерной структуры белка в базе PDB. Для Euzebya pacifica такие данные на данный момент отсутствуют.

Аннотации трансмембранных участков (TRANSMEM) также не были добавлены в данный протеом. Это демонстрирует важную особенность работы с автоматически аннотированными протеомами: не все типы аннотаций присутствуют.

4. Оценка количества ферментов в протеоме

Для оценки количества ферментов использованы два подхода: поиск по полю Enzyme Commission number и поиск по ключевым словам.

Запрос 1 (по полю EC):

(proteome:UP000264006) AND (ec:*)

Запрос 2 (по ключевым словам):

(proteome:UP000264006) AND (keyword:enzyme OR keyword:hydrolase OR keyword:transferase OR keyword:oxidoreductase OR keyword:lyase OR keyword:isomerase OR keyword:ligase)

Результаты:

Метод оценкиКоличество белковДоля от общего числа (5 625)
По полю EC (строгий метод)75413.4%
По ключевым словам (расширенный метод)1 69130.1%
Анализ полученных оценок:

Реалистичная оценка доли ферментов в протеоме Euzebya pacifica находится между этими двумя значениями. Для бактерий типичная доля ферментов составляет 30-50% от всех белков, что делает оценку по ключевым словам (30.1%) более реалистичной.

Заключение

В ходе выполнения практикума №8 были решены следующие задачи:

  1. Найден протеом UP000264006, соответствующий геномной сборке Euzebya pacifica DY32-46.
  2. (5 625 белков).
  3. Проведён анализ аннотаций вторичной структуры: аннотации HELIX и TRANSMEM отсутствуют, что объясняется автоматическим характером протеома (TrEMBL).
  4. Выполнена оценка количества ферментов: по EC-полю найдено 754 белка (13.4%), по ключевым словам — 1 691 белок (30.1%).