Поиск протеома
Поиск протеома проходил на NCBI Datasets, в качестве запроса использовалось полное название моего штамма Thalassospira marina (ID штамма: 2048283). Было получено два результата, один из которых является референсным (ID сборки на RefSeq:GCF_002844375.1 | ID сборки на INSDC:GCA_002844375.1).
Поиск в UniProt Proteomes (по запросу [Taxonomy [OC]:2048283]) дал 2 результата: 1 неизвестную протеому и 1 удалённую, референсных протеом не оказалост. Поэтому было принято решение сделать запрос на поиск по роду (запрос [Taxonomy [OC]:168934]). Результат-13 протеом, 2 из которых референсные. Наиболее удачной мне показалась протеома с ID:UP000032356, так как её сравнительные анализ состоит на 99% из полных генов с одной копией).
Скачивание протеомы
С помощью запроса proteome:UP000032356 в UniProtKB было получено 3669 результатов.Архив в формате .gz был скачан с помощью команды:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000032356)' -O UP000032356.swiss.gz
Оценка числа ферментов
Bash:zgrep -c 'CATALYTIC ACTIVITY' UP000032356.swiss.gz | less. 804 выдачи.
UniProt: запрос(proteome:UP000032356) AND (ec:*)). 739 результатов.
Возможно, результаты выдачи у UniProt и Bash различны, так как Bash скрипт может учитывать один белок несколько раз(в описании 'CATALYTIC ACTIVITY' может встречаться повтороно или даже несколько раз).
Анализ протеома консольными средствами
Задача была выполнена с помощью использования программы на Python.
Наиболее интересной идее мне показалось сравнить долю каждого конкретного класса ферментов(по EC) среди всех ферментов.С помощью скрипта были получены следуюзие результаты:
Оксидоредуктаза | 16.032% |
---|---|
Трансфераза | 37.408% |
Гидролаза | 16.900% |
Лиаза | 11.690% |
Изомераза | 5.812% |
Лигаза | 19.285% |
Транслоказа | 2.872% |
Высокая доля ферментов класса трансфераза у бактерий указывает на их способность эффективно переносить функциональные группы между молекулами, что важно для метаболических процессов. Это может свидетельствовать о высокой активности в синтезе и модификации биомолекул, необходимых для роста и адаптации.