Uniprot Proteomes for Citrobacter tructae

Поиск протеома

Информация протеома:

Идентификатор RefSeq: GCF_004684345.1

Страница из базы NCBI Datasets Genome: https://www.ncbi.nlm.nih.gov/datasets/genome/GCF_004684345.1/

Идентификатор последней версии сборки INSDC: GCA_004684345.1

Был сделан общий поиск в UniProt Proteomes по ID INSDC и найден протеом с ID UP000296284 и статусом "Исключено" (отложено для дальнейшего анализа).

Оценка количества ферментов в протеоме

Было получено 1278 белков с аннотированной ферментативной активностью. Для анализа использовались следующие методы:

Поиск и скачивание референсного протеома

При поиске по таксону того же вида (TaxID: ) референсный протеом найти не удалось, поэтому был произведен поиск по его родительскому (TaxID: ) и был найден референсный протеом с Proteome ID: UP000001889

Оценка количества ферментов в протеоме

На сайте UniProtKB через расширенный поиск.

Параметры расширенного поиска: Proteome ID: UP000001889 Catalytic activity: * было найдено 1035 фермента.

Поиск через bash и скачанный протеом

Поиск был произведен через конвейер: zgrep -e 'CATALYTIC ACTIVITY' -e '^SQ' UP000001889.swiss.gz | grep -A1 '^CC' | grep '^SQ' -c Было найдено 1035 ферментов, что соответствует поиску через расширенный поиск.

Анализ протеома консольными средствами

При помощи конвейера были посчитаны pI белков и оформлена в виде таблицы:

Распределение белков по изоэлектрическим точкам
Группа pI Белков % от общего
0-3 0 0.0%
3-6 1,719 35.9%
6-7 544 11.4%
7-10 1,503 31.4%
10-14 1,026 21.4%
У бактерии преобладают кислые белки, что является одним из признаков мезофильных бактерий. Это означает, что бактерия хуже всего переносит именно кислую среду. Также есть характерное падение в районе 6-7, что указывает на околонейтральный pH бактерии.

сам конвейер: zgrep "^SQ " UP000001889.swiss.gz -A1 | grep -v "^--" | grep -v "^SQ " | awk '{print ">seq_" NR "\n" $0}' | pepstats -filter -auto -stdout 2>/dev/null | grep "Isoelectric Point" | cut -d'=' -f2 | awk '{pi=$1; if(pi<3) g="0-3"; else if(pi<6) g="3-6"; else if(pi<7) g="6-7"; else if(pi<10) g="7-10"; else g="10-14"; c[g]++} END {print "Группа pI\tБелков\t% от общего"; t=c["0-3"]+c["3-6"]+c["6-7"]+c["7-10"]+c["10-14"]; for(g in c) printf "%s\t%d\t%.1f%%\n", g, c[g], c[g]/t*100}' | column -t -s $'\t'