Практикум 8

Поиск протеома

Идентификатор своей сборки был взят из 5 практимума 1 семестра

Страница геномной сборки: NCBI Datasets

ID сборки на RefSeq:GCF_002844375.1

ID сборки на INSDC: GCA_002844375.1

Поиск в UniProt Proteomes (по запросу genome_assembly:GCA_002844375.1) протэом c ID UP000233458

Статус протеом: Избыточный протеом для  UP000233597

Поиск и скачивание протеомы

Так как референсного протэома (по запросу genome_assembly:GCA_002844375.1) найдено небыло, поэтому я выполнила поиск по роду Thalassospira (taxonomy_id:168934). Нашлось 89 протэом , из них 2 референсные. Для дальнейшей работы я выбрала ID протэом:UP000032356. Его сравнительные анализ состоит на 99% из полных генов с одной копией.

Протеом был загружен через интерфейс UniProtKB (запрос proteome:UP000032356) с помощью команды:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=swiss&query=(proteome:UP000032356)' -O UP000032356.swiss.gz

Оценка числа ферментов

Bash:zgrep -c 'CATALYTIC ACTIVITY' UP000032356.swiss.gz | less. 804 выдачи.

UniProt: запрос(proteome:UP000032356) AND (ec:*)). 739 результатов.

Возможно, результаты выдачи у UniProt и Bash различны, так как Bash скрипт может учитывать один белок несколько раз(в описании 'CATALYTIC ACTIVITY' может встречаться повтороно или даже несколько раз).

Анализ протеома консольными средствами

Задача была выполнена с помощью использования программы на Python.

Наиболее интересной идее мне показалось сравнить долю каждого конкретного класса ферментов(по EC) среди всех ферментов.С помощью скрипта были получены следуюзие результаты:

Оксидоредуктаза16.032%
Трансфераза37.408%
Гидролаза16.900%
Лиаза11.690%
Изомераза5.812%
Лигаза19.285%
Транслоказа2.872%

Высокая доля ферментов класса трансфераза у бактерий указывает на их способность эффективно переносить функциональные группы между молекулами, что важно для метаболических процессов. Это может свидетельствовать о высокой активности в синтезе и модификации биомолекул, необходимых для роста и адаптации.