Практика работы с протеомом бактерии Moraxella ovis
Петренко Павел
Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова
Поиск протеома, соответствующего геномной сборке
Идентификатор геномной сборки RefSeq: GCF_001636015.1
Ссылка на страницу из базы NCBI Datasets Genome, сответствующая данной сборке: GCF_001636015.1
Идентификатор последней версии сборки INSDC: GCA_001636015.1
Поисковый запрос по UniProt Proteomes, который выдал протеом: (genome_assembly:GCA_001636015.1). В данном случае я воспользовался идентификатором сборки INSDC для поиска протеома бактерии в базе данных UniProt Proteomes.
Идентификатор протеома: UP000076765
Статус протеома: redundant proteome (избыточный протеом). Такая пометка (избыточный протеом) означает, что раннее уже был описан протеом другой бактерии штамма Moraxella ovis, и этот протеом имеет наиболее полный состав (то есть белки, которые входят в протеом со статусом redundant уже были выявлены в схожем геноме раннее). Таким образом, избыточный протеом с идентификатором UP000076765 был исключён в пользу протеома с идентификатором UP000255102, имеющего статус other proteome (то есть неизбыточный). Интересно, что сам протеом, в пользу которого был исключён исходный, является частью панпротеома близкой бактерии Moraxella bovoculi 237 (237 - номер штамма)
Поиск и скачивание референсного протеома
Первый поисковый запрос для референсного протеома: (taxonomy_id:29433) AND (proteome_type:1). Так я хотел посмотреть референсные пртеомы для вида Moraxella ovis, но результатов не нашлось. Тогда я решил, что стоит взять таксон повыше, то есть род
Второй поисковый запрос для референсного протеома: (taxonomy_id:475) AND (proteome_type:1). Теперь нашлось сразу 11 результатов (это хорошо). Из всех найденный протеомов я решил быбрать протеом бактерии Moraxella bovoculi 237 с идентификатором UP000035860. Этот протеом не имеет CPD (Complete Proteome Detector) Standart (то есть близкая схожесть с исходным протеомом), но зато, как я уже писал до этого, исходный протеом является частью протеома данной бактерии, из-за чего я решил, что будет рационально исследовать именно его
Команда для скачивания:
wget 'wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000035860)' -O ~/term2/pr8/UP000035860.swiss.gzФункция -O позволяет нам сохранить файл под тем именет, которое нам нужно
Оценка количества ферментов в протеоме
Поисковый запрос:
(proteome:UP000035860) AND (ec:1 OR ec:2 OR ec:3 OR ec:4 OR ec:5 OR ec:6 OR ec:7) ИЛИ (proteome:UP000035860) AND (ec:*)Эти поисковые запросы (они абсолютно равнозначны) позволяют оценить, сколько белков распределены по различным классам ферментов. Недостаток такого поиска может заключаться в том, что идентификаторы EC присваиваются белкам автоматически, например, исходя из аминокислотной схожести. Так, некоторые из этих белков могут относиться к ферментам, но при этом не проявлять каталитическую активность. Результат: 565 белка
Конвейер в bash:
zcat UP000035860.swiss.gz| grep 'DE'| grep -c 'EC='С помощью этого конвеера я сначала отобрал те строки, которые содержат описание белков, а затем из этих строк выбрал все те из, которые содержат идентификатор фермента и посчитал. Результат: 589 белков
Значения в 565 и 589 белков могут разниться, например из-за некоторых дубликатов ферментов, которые в UniProt не учитываются. Однако, различия составляют всего 4,25%, что является нормой
Анализ протеома консольными средствами
Конвейер в bash:
zcat UP000035860.swiss | grep 'DE'| grep -o 'EC=[0-7]' | sort | uniq -cМне стало интересно, как распределяются ферменты по классам, и какие их них преобладают в протеоме моей бактерии. Для этого я использовал команду grep -o, которая помогла мне найти конкретные выражения (в данном случае типы ферментов), отбросив при этом лишнюю информацию. затем я отсортировал и посчитал получившиеся значения. Сразу стоит заметить, что общая сумма ферментов составила 589, что соответствует подсчёту из предыдущего задания. Следовательно, значения соответствуют реальным.
Также можно заметить, что из всех ферментов количество трансфераз явно превышает количество других типов ферментов. Это можно связать с патогенным образом жизни Moraxella ovis. Так, трансферазы выполняют немало важных функций для патогенного образа жизни Moraxella ovis:
- Адаптация к стрессовым условиям: трансферазы выводят токсины (например, антибиотики или продукты окислительного стресса), поддерживают ионный баланс в ответ на кислотный стресс в воспалённых тканях глаза или осмотический стресс в слёзной жидкости
- Вирулентность и взаимодействие с хозяином: трансферазы экспортируют факторы вирулентности (некоторые трансферазы секретируют белки, повреждающие ткани (например, протеазы)), импортируют питательные вещества из среды при ограниченном питании (например, в слезной жидкости)
- Устойчивость к антибиотикам: существуют эффлюксные насосы (подкласс трансфераз), которые активно выводят антибиотики из клетки
- Также на количество трансфераз могли повлиять собенности генома: горизонтальный перенос генов (многие гены трансфераз могли быть приобретены от других бактерий) или дублирование генов (увеличение числа копий критически важных транспортеров)
Тип фермента | Количество |
---|---|
Оксидоредуктазы | 78 |
Трансферазы | 210 |
Гидролазы | 110 |
Лиазы | 59 |
Изомеразы | 47 |
Лигазы | 62 |
Транслоказы | 23 |