Для этого практикума были выбраны протеомы бактерий, принадлежащих к семейству Xanthomonadaceae.
Первым был выбран референсный протеом бактерии Xanthomonas oryzae pv. oryzae, вызывающей бактериальные ожоги риса. Идентификатор - UP000006735, количество белков - 4382, BUSCO - 96,5%.
Контрольный референсный протеом принадлежит Lysobacter enzymogenes (strain C3). Данная бактерия наоборот препятствует поражению растений фитопатогенами, в частности, заражению оомицетами [1]. Идентификатор - UP000061569, количество белков - 5514, BUSCO - 99,3%.
Команды для скачивания протеомов:
1. wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=UP000006735' -O UP000006735.swiss.gz
2. wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=UP000061569' -O UP000061569.swiss.gz
1) Для подсчёта количества трансмембранных белков были использованы следующие команды:
2) Для поиска количества ферментов:
3) В статье [2] содержится информация о том, что продукт синтеза гена clp бактерии L. enzymogenes C3 участвует в подавлении заражения растения грибами. Я решила проверить, есть ли этот ген у X. oryzae, запрос в UniProt - (gene:clp ) AND (taxonomy_name:Xanthomonas oryzae pv. oryzae). Был получен 1 результат для данного организма.
Можно предположить, что либо X. oryzae тоже обладает противогрибной активностью, либо clp выполняет в этой бактерии другую функцию. При этом в статье [3] приводится информация о том, что Crp-Like Protein (продукт биосинтеза clp) влияет на патогенность бактерии как положительно, так и отрицательно (исследование проводилось на других представителях семейства Xanthomonadaceae).
Подсчёт количества:
Результаты сравнения двух протеомов находятся в Таблице 1.
Xanthomonas oryzae | Lysobacter enzymogenes C3 | |
---|---|---|
Общее количество белков | 4382 | 5514 |
Трансмембранные белки | 691 (15,77%) | 959 (17,39%) |
Ферменты | 30 (0,68%) | 37 (0,67%) |
CRP-like protein Clp | 2 (0,05%) | 4 (0,07%) |
Я решила проверить, с какой аминокислоты начинаются белки в протеоме бактерий и совпадают ли данные о количестве белков в UniProt с результатами кода Python. Данные совпадают, и все белки начинаются с метионина.