UniProt Proteomes
Поиск протеома, соответствующего геномной сборке.
При помощи поиска по базе NCBI Datasets Genome, был получен идентификатор
RefSeq генома бактерии Paracidovorax citrulli штамма
NWB SC196. Версия сборки
генома за прошедшие полгода не менялась.
NCBI RefSeq: GCF_022493915.1
При помощи указанного ниже запроса в UniProt Proteomes была осуществлена попытка получить протеом данного штамма. Однако в базе данных протеом для данной сборки отсутствовал.
(genome_assembly:GCA_022493915.1)
Так как для данной сборки, к слову, являющейся референсной сборкой, не было найдено соответствующего протеома, я решил проверить количество протеомов в UniProt Proteomes для вида Paracidovorax citrulli. При помощи запроса (taxonomy_id:80869) были получены все протеомы в базе данных: их 13 (1 со статусом other proteom и 12 со статусом redundant proteom) и среди них не оказалось ни одного референсного.
Поиск и скачивание референсного протеома
Как уже было сказано ранее, для вида в базе нет ни одного референсного протеома. Однако уже для рода Paracidovorax было найдено 2 референсных протеома
(taxonomy_id:3051137) AND (proteome_type:1)
Один из них принадлежал Paracidovorax avenae, другой Paracidovorax valerianellae. Первая из них поражает сахарный тростник (red stripe disease), вторая вызывает заболевание полевого салата (Valeriana locusta) [1, 2]. Вид бактерий, который был в миниобзоре, Paracidovorax citrulli, является возбудителем пятнистости растений различных видов семейства Тыквенные (Cucurbitaceae) [3]. В качестве протеома для дальнейшего исследования я выбрал протеом вида Paracidovorax avenae, так как его значение BUSCO лучше (C:100% (S:99.9% D:0.1%) F:0% M:0% против C:99.1% (S:99.1% D:0%) F:0.3% M:0.6%).Proteome ID: UP000002482
Конвейер для скачивания сжатого протеома: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000002482)' -O UP000002482.swiss.gz
Оценка количества ферментов в протеоме
Ниже указаны 2 запроса в UniProt и конвейер bash, с помощью которых я попытался оценить количество ферментов среди белков. Соответственно были получены: 1259, 769, 769. Из этого мы можем понять, в-первых, что конвейер bash правильно считает количество белков, для которых описана каталитическая активность. Во-вторых, не у всех ферментов написана каталитическая активность: для 490 она, видимо, не описана.
Запрос UniProt для числа ферментов: 1)(proteome:UP000002482)AND(EC:*); 2)(proteome:UP000002482)AND(cc_catalytic_activity:*)
Конвейер для числа ферментов: zgrep -E 'CATALYTIC ACTIVITY|---' UP000002482.swiss.gz | uniq | grep 'CATALYTIC ACTIVITY' | uniq -c | less
Количество транспозаз.
При помощи нижеприведенного конвейера в файл записываются ID транспозаз, находящихся в выбранном протеооме.
Конвейер для получения транспозаз:
zgrep -E 'ID |transposase' UP000002482.swiss.gz | grep -B 1 'transposase'| grep ID | tr -s ' ' | cut -f 2 -d ' ' > transposase_ids.txt
В своем миниобзоре я уделил много внимания мобильным элементам бактерии, а именно, генам транспозаз. Всего в референсном протеоме обнаружено 13 транспозаз.
Для сравнения, в геноме штамма NWB SC196 Paracidovorax citrulli их было 50.
У некоторых бактерий активность транспозаз контролируется изменением внешних условий: когда условия становятся неблагоприятными увеличивается
активность мобильных генетических элементов, которые, по каким-то причинам, увеличивают выживаемость бактерий.
Так что из наблюдения можно сделать предположение, что геном Paracidovorax citrulli больше склонен к
изменениям, чем геном Paracidovorax avenae, а следовательно болезни растений, вызванные Paracidovorax citrulli, возможно, являются более
устойчивыми.
Список литературы.
[1] Chu N, Sun HD, Zhou JR, Fu HY, Li XY, Gao SJ. Research advances of sugarcane red stripe disease and its pathogeny biology. Sugar Crops China.
[2] Gardan L, Stead DE, Dauga C, Gillis M. Acidovorax valerianellae sp. nov., a novel pathogen of lamb’s lettuce [Valerianella locusta (L.) Laterr] Int J Syst Evol Microbiol. 2003;53:795–800.
[3] Schaad NW, Sowell Jr G, Goth RW, Colwell RR, Webb RE. Pseudomonas pseudoalcaligenes subsp. citrulli subsp. nov. Int J Syst Bacteriol 1978;28:117–125.