Uniprot Proteomes for Citrobacter tructae
Поиск протеома
Информация протеома:
Идентификатор RefSeq: GCF_004684345.1
Страница из базы NCBI Datasets Genome: https://www.ncbi.nlm.nih.gov/datasets/genome/GCF_004684345.1/
Идентификатор последней версии сборки INSDC: GCA_004684345.1
Был сделан общий поиск в UniProt Proteomes по ID INSDC и найден протеом с ID UP000296284 и статусом "Исключено" (отложено для дальнейшего анализа).
Оценка количества ферментов в протеоме
Было получено 1278 белков с аннотированной ферментативной активностью. Для анализа использовались следующие методы:
Поиск и скачивание референсного протеома
При поиске по таксону того же вида (TaxID: ) референсный протеом найти не удалось, поэтому был произведен поиск по его родительскому (TaxID: ) и был найден референсный протеом с Proteome ID: UP000001889
Оценка количества ферментов в протеоме
На сайте UniProtKB через расширенный поиск.
Параметры расширенного поиска: Proteome ID: UP000001889 Catalytic activity: * было найдено 1035 фермента.
Поиск через bash и скачанный протеом
Поиск был произведен через конвейер: zgrep -e 'CATALYTIC ACTIVITY' -e '^SQ' UP000001889.swiss.gz | grep -A1 '^CC' | grep '^SQ' -c Было найдено 1035 ферментов, что соответствует поиску через расширенный поиск.
Анализ протеома консольными средствами
При помощи конвейера были посчитаны pI белков и оформлена в виде таблицы:
Группа pI | Белков | % от общего |
---|---|---|
0-3 | 0 | 0.0% |
3-6 | 1,719 | 35.9% |
6-7 | 544 | 11.4% |
7-10 | 1,503 | 31.4% |
10-14 | 1,026 | 21.4% |