Выбор и скачивание протеомов

К сожалению, протеом моей бактерии - Campylobacter coli - оказался нереференсным, поэтому я остановилась на ближайшем родственном организме - бактерии Campylobacter jejuni.

Второй протеом, контрольный, принадлежит бактерии Helicobacter hepaticus, относящейся к порядку Campylobacterales. Почти все бактерии из Campylobacterales являются патогенными. Мне показалось бессмысленным искать не патогенную бактерию в других порядках (в этом случае сходств могло не быть вовсе), поэтому я осталась в текущем таксоне. Более того, геном H. hepaticus содержит гены, кодирующие некоторые факторы вирулентности ортологов Campylobacter jejuni, такие как цитолетальный токсин растяжения (CDT) и фактор адгезии PebI. Такое сходство показалось мне интересным.

Campylobacter jejuni serotype O:2 (strain ATCC 700819 / NCTC 11168):
ID: UP000000799
Protein count (total): 1623
Amount of proteins in Swiss-Prot: 473
CPD: Close to standart (low value)
BUSCO: 100%
The proteome was downloaded using the command:
wget ‘https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=UP000000799' -O UP000000799.swiss.gz

Helicobacter hepaticus (strain ATCC 51449 / 3B1):
ID: UP000002495
Protein count (total): 1872
Amount of proteins in Swiss-Prot: 320
CPD: Outlier (high value)
BUSCO: 98,6%
The proteome was downloaded using the command:
wget ‘https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=UP000000799' -O UP000002495.swiss.gz

Сравнение протеомов по представленности определенных групп белков

Трансмембранные белки

Campylobacter jeluni: 346
(proteome:UP000000799) AND (ft_transmem:*)

Helicobacter hepaticus: 377
(proteome:UP000002495) AND (ft_transmem:*)

Ферменты

Campylobacter jeluni: 30
(proteome:UP000000799) AND (cc_function:enzyme)

Helicobacter hepaticus: 26
(proteome:UP000002495) AND (cc_function:enzyme)

Факторы вирулентности

Также я нашла в протеомах цитолетальный токсин растяжения (CDT) - он встречается 1 раз и там, и там ((proteome:UP000000799) AND (protein_name:CDT)) и ((proteome:UP000002495) AND (protein_name:CDT) соответственно), а также фактор адгезии (встречается только у Campylobacter jejuni: (proteome:UP000000799) AND (cc_function:adhesion)). Такие находки вполне объясняются образом жизни бактерий: бактерии из рода Campylobacter обитают на слизистых поверхностях.

Сравнение протеомов по...

...количеству аминокислот

Я решила написать код, который будет считать количество каждой аминокислоты в протеоме. Код можно найти тут. Результат его работы:

camp
Таблица 1. Результаты подсчёта аминокислот в протеоме Campylobacter jejuni.
helic
Таблица 2. Результаты подсчёта аминокислот в протеоме Helicobacter jejuni.



Протеомы бактерий имеют разный размер, однако если учесть это при сравнении, окажется, что количетсво аминокислот можно соотнести (правда, довольно грубо).
Можно заметить, что в протеоме Campylobacter jejuni присутствует селеноцистеин (U). Действительно, в протеоме C. jejuni есть белки, содержащие селеноцистеин, например, белок с ID: Q0P8A7_CAMJE. Это - предполагаемая большая субъединица формиатдегидрогеназы (содержащая селеноцистеин). В статье я нашла информацию о том, что бактериальный патоген Campylobacter jejuni, передающийся с пищей , эффективно использует органические кислоты, такие как лактат и формиат, для производства энергии. Формиат быстро метаболизируется за счет активности фермента мультисубъединичной формиатдегидрогеназы (FDH), субъединица FdhA которого, по прогнозам, содержит аминокислоту селеноцистеин (SeC). В протеоме H. hepaticus селеноцистеина нет.