Практикум 8

Поиск протеома

Поиск протеома проходил на NCBI Datasets, в качестве запроса использовалось полное название моего штамма Thalassospira marina (ID штамма: 2048283). Было получено два результата, один из которых является референсным (ID сборки на RefSeq:GCF_002844375.1 | ID сборки на INSDC:GCA_002844375.1).

Поиск в UniProt Proteomes (по запросу [Taxonomy [OC]:2048283]) дал 2 результата: 1 неизвестную протеому и 1 удалённую, референсных протеом не оказалост. Поэтому было принято решение сделать запрос на поиск по роду (запрос [Taxonomy [OC]:168934]). Результат-13 протеом, 2 из которых референсные. Наиболее удачной мне показалась протеома с ID:UP000032356, так как её сравнительные анализ состоит на 99% из полных генов с одной копией).

Скачивание протеомы

С помощью запроса proteome:UP000032356 в UniProtKB было получено 3669 результатов.Архив в формате .gz был скачан с помощью команды:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000032356)' -O UP000032356.swiss.gz

Оценка числа ферментов

Bash:zgrep -c 'CATALYTIC ACTIVITY' UP000032356.swiss.gz | less. 804 выдачи.

UniProt: запрос(proteome:UP000032356) AND (ec:*)). 739 результатов.

Возможно, результаты выдачи у UniProt и Bash различны, так как Bash скрипт может учитывать один белок несколько раз(в описании 'CATALYTIC ACTIVITY' может встречаться повтороно или даже несколько раз).

Анализ протеома консольными средствами

Задача была выполнена с помощью использования программы на Python.

Наиболее интересной идее мне показалось сравнить долю каждого конкретного класса ферментов(по EC) среди всех ферментов.С помощью скрипта были получены следуюзие результаты:

Оксидоредуктаза16.032%
Трансфераза37.408%
Гидролаза16.900%
Лиаза11.690%
Изомераза5.812%
Лигаза19.285%
Транслоказа2.872%

Высокая доля ферментов класса трансфераза у бактерий указывает на их способность эффективно переносить функциональные группы между молекулами, что важно для метаболических процессов. Это может свидетельствовать о высокой активности в синтезе и модификации биомолекул, необходимых для роста и адаптации.