Практикум 8

Поиск протеома, соответствующего геномной сборке
Идентификатор сборки RefSeq: GCF_000196215.1
Ссылка на страницу из базы NCBI Datasets Genome
Идентификатор сборки INSDC: GCA_000196215.1
Поисковый запрос по UniProt Proteomes: (genome_assembly:GCA_000196215.1)
Идентификатор протеома: UP000002276
Статус: Other proteome
Поиск и скачивание референсного протеома
При поиске референсного генома того же вида в Proteomes taxonomy_id:290434 был найден избыточный геном UP000274630 для UP000002276, поэтому его нельзя использовать в качестве референсного. Далее проводился поиск по таксону, который указан в качестве родительского на странице вида в базе Taxonomy (Borreliella bavariensis, Taxon ID 664662), были получены те же результаты, что и при первом поисковом запросе. Родительская группа для Borreliella bavariensis - Borreliella, Taxon ID 64895. В результате поиска было выдано 159 вариантов, из которых 1 референсный, 18 прочие протеомы, 131 избыточные и 9 удалённых.
Референсный
Proteome ID: UP000001807, Scientific name: Borreliella burgdorferi, Taxon ID: 224326, CPD: Unknown, BUSCO: C:93.3% (S:93.3% D:0%) F:0% M:6.7%.
Оценка количества ферментов в протеоме

Поисковый запрос: (proteome:UP000001807) AND ((ec:*) OR (cc_function:enzyme) OR (keyword:KW-0172)). Данный запрос нашёл все белки с ферментативной активностью, их количество совпало с тем, которое должно быть 239 (proteome:UP000001807) и Group by: Enzyme Class

Рис. 1 Деление на группы по классу ферментов среди всех белков

Рис. 2 Результаты поиска белков с ферментативной активностью

Конвейер bash: zgrep '^DR.*EC' UP000001807.swiss.gz | wc -l. Данный конвейер тоже выдал 239 белков с ферментавтивной активностью.

Анализ протеома консольными средствам
В мини-обзоре были описаны белки, участвующие в реализации болезни Лайма. В этом практикуме с помощью команд в bash было проверено все ли эти белки встречаются у Borreliella burgdorferi.
zgrep -i "Outer surface protein C" UP000001807.swiss.gz Vsp/OspC family lipoprotein
zgrep -i "Alpha3-beta1 integrin-binding protein" UP000001807.swiss.gz
zgrep -i "OMS28" UP000001807.swiss.gz OMS28 family porin
zgrep -i "BB_A07" UP000001807.swiss.gz BBA07 family lipoprotein
zgrep -i "Lp6.6 protein" UP000001807.swiss.gz Lp6.6 family lipoprotein
zgrep -i "BB_A14" UP000001807.swiss.gz BBA14 family lipoprotein
zgrep -i "OspA" UP000001807.swiss.gz outer surface lipoprotein OspA
zgrep -i "OspB" UP000001807.swiss.gz outer surface lipoprotein OspB
zgrep -i "DbpB" UP000001807.swiss.gz decorin-binding protein DbpB
zgrep -i "DbpA" UP000001807.swiss.gz decorin-binding protein DbpA
zgrep -i "ankyrin" UP000001807.swiss.gzn ankyrin repeat domain-containing protein
zgrep -i "BptA" UP000001807.swiss.gz
zcat UP000001807.swiss.gz | grep -i "virulence" Благодаря этому конвейеру были найдены
дополнительные белки, в описании которых
встречается слово "virulence":
Right handed beta helix domain-containing protein, LysM domain protein.