Uniprot Proteomes for Citrobacter tructae

Поиск протеома

Идентификатор RefSeq: GCF_004684345.1

Страница из базы NCBI Datasets Genome: https://www.ncbi.nlm.nih.gov/datasets/genome/GCF_004684345.1/

Идентификатор последней версии сборки INSDC: GCA_004684345.1

Был сделан поиск в UniProt Proteomes по ID INSDC. Запрос выглядел так: (genome_assembly:GCA_004684345.1). Был найден 1 протеом с ID UP000296284 и статусом: "Исключен (отложен для дальнейшего анализа)"(Excluded (delayed for further analysis))

Поиск и скачивание референсного протеома

При поиске по таксону того же вида (TaxID:2562449) референсный протеом найти не удалось, поэтому был произведен поиск по его родительскому (TaxID:544) и был найдено 5 референсных протеомов и выбран с Proteome ID: UP000001889

Запрос для поиска референсногопротеома для Citrobacter tructae: (proteome_type:1) AND (taxonomy_id:2562449)

Запрос для поиска референсногопротеома для Citrobacter: (proteome_type:1) AND (taxonomy_id:544)

ссылка на выбранный протеом

ссылка для скачивания протеома

Команда для скачивания через bash:

curl -sL "https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000001889" -o up000001889.gz

Оценка количества ферментов в протеоме

Всего в протеоме 4792 белка. Для подсчета количества белков, обладающих какой-либо ферментативной функцией, были использованы следующие методы:

На сайте UniProtKB через расширенный поиск.

Параметры расширенного поиска: Proteome ID: UP000001889 Catalytic activity: * Одним запросом: (proteome:UP000001889) AND (cc_catalytic_activity:*) было найдено 1035 фермента.

Поиск через bash и скачанный протеом

Поиск был произведен через конвейер: zgrep -e 'CATALYTIC ACTIVITY' -e '^SQ' UP000001889.swiss.gz | grep -A1 '^CC' | grep '^SQ' -c Было найдено 1035 ферментов, что соответствует поиску через расширенный поиск.

Анализ протеома консольными средствами

При помощи скрипта на языке програмирования Python были посчитаны pI белков и оформлена в виде таблицы:

Распределение белков по изоэлектрическим точкам
Группа pI Белков % от общего
0-3 0 0.0%
3-6 1,719 35.9%
6-7 544 11.4%
7-10 1,503 31.4%
10-14 1,026 21.4%
У бактерии преобладают белки с группами, дающими кислую среду, что является одним из признаков нейтрального или нейтрально-щелочного места обитания. Это означает, что бактерия хуже всего переносит именно кислую среду. Также есть характерное падение количества белков при pH в районе 6-7, что указывает на околонейтральный pH самой бактерии. Действительно, Citrobacter tructae был выделен из почек форели, в которых имеется слабощелочная среда (за счет аммиака).
  • скрипт