Практикум 8

или "найди отличия, часть 2"

Сравнение протеомов бактерий

1. Выбор и скачивание протеомов

Я использовала расширенный поиск Uniprot, чтобы найти нужные для задания протеомы. Выбрала базу Proteomes, поставила фильтр Organism [OS] и ввела название своей бактерии Erysipelothrix larvae. Поиск выдал мне 1 результат. Протеом бактерии Erysipelothrix larvae референсный, состоящий из 2225 белков, ни один из которых не был добавлен из Swiss-Prot. Т.е. все данные проверялись автоматически, а не вручную, и гарантировать их правильность нельзя. Также вызвало опасение значение CPD: outlier (high value). Т.е. у этой бактерии белков сильно больше чем стандартное значение в этом таксоне. Вероятно, при получении протеома были допущены какие-то ошибки (например, попадание белков других бактерий), которые и привели к такому отклонению от стандартного значения. Также, возможно, значение CPD могло быть выше стандартного из-за того, что бактерия Erysipelothrix larvae является единственной среди рода Erysipelothrix устойчивой к мышьяку, хотя не думаю, что в таком случае значения отличались бы настолько кардинально.

В качестве бактерии, чей протеом будет выступать контрольным, была выбрана бактерия Erysipelothrix rhusiopathiae ATCC 19414 (ATCC 19414). Она также относится к роду Erysipelothrix, является более изученной и, что самое главное, не обладает устойчивостью к мышьяку. Протеом этой бактерии также референсный, содержащий 1644 белка, ни один из которых не был добавлен из Swiss-Prot. Значение CPD у данного протеома стандартное.

Erysipelothrix larvae

• Proteome ID: UP000063781

• Protein count: 2225

• CPD: Outlier (high value)(!!!)

• BUSCO: C:89% (S:89% D:0%) F:0% M:11%

• Белков из Swiss-Prot: 0

Erysipelothrix rhusiopathiae

• Proteome ID: UP000003028

• Protein count: 1644

• CPD: Standard

• BUSCO: C:87.6% (S:87.2% D:0.5%) F:0.9% M:11.5%

• Белков из Swiss-Prot: 0

Рис.1. Результаты поиска для Erysipelothrix larvae

Рис.2. Результаты поиска для Erysipelothrix rhusiopathiae

Для скачивания протеомов были использованы следующие команды:

Для Erysipelothrix larvae: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000063781)' -O UP000063781.swiss.gz

Для Erysipelothrix rhusiopathiae: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000003028)' -O UP000003028.swiss.gz

2. Сравнение протеомов по представленности определенных групп белков

Erysipelothrix larvae

1. Трансмембранные белки

Запрос для поиска: (proteome:UP000063781) AND (ft_transmem:*)

Полученный ответ: 549

2. Ферменты

Запрос для поиска: (proteome:UP000063781) AND (ec:*)

Полученный ответ: 384

Erysipelothrix rhusiopathiae

1. Трансмембранные белки

Запрос для поиска: (proteome:UP000003028) AND (ft_transmem:*)

Полученный ответ: 439

2. Ферменты

Запрос для поиска: (proteome:UP000003028) AND (ec:*)

Полученный ответ: 574

Как говорилось ранее, Erysipelothrix larvae отличается от Erysipelothrix rhusiopathiae устойчивостью к мышьяку, так что в качестве третьего белка для сравнения был выбран белок, отвечающий за эту устойчивость. Статью по данной теме можно найти по данной ссылке. Я уже проводила похожее исследование в 1 семестре при написании мини-обзора, когда искала количество подобных белков у Erysipelothrix larvae средствами BASH(про это можно прочитать здесь). Сейчас же для поиска были использованы возможности Uniprot. В качестве белка для сравнения был использован ATPase, про него также можно прочитать тут.

Erysipelothrix larvae

Запрос для поиска: (taxonomy_id:1514105) AND (protein_name:ATPase)

Полученный ответ: 35

Интересно, что при подсчете ATPase в мини-обзоре результат вышел на 3 меньше, т.е. 32. Такая разница позволяет предположить то, что поиск в Uniprot является более точным.

Erysipelothrix rhusiopathiae

Запрос для поиска: (taxonomy_id:1648) AND (protein_name:ATPase)

Полученный ответ: 24

3. Сравнение протеомов по первой аминокислоте в каждом белке

Я решила проверить, правда ли, что первая аминокислота в каждом белке — метионин. Для этого я использовала BASH и следующий конвейер из команд:

zcat UP000063781.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | sort | uniq -c для Erysipelothrix larvae

Выдача: 2225 M

zcat UP000003028.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | sort | uniq -c для Erysipelothrix rhusiopathiae

Выдача: 1 I, 1643 M

Erysipelothrix larvae иллюстрирует стандартную ситуацию, когда первой аминокислотой является метионин. У Erysipelothrix rhusiopathiae же помимо метионина есть еще одна аминокислота — изолейцин. Возможно подобное исключение как-то связано с посттрансляционными модификациями.