Практикум 8
или "найди отличия, часть 2"
Сравнение протеомов бактерий
1. Выбор и скачивание протеомов
Я использовала расширенный поиск Uniprot, чтобы найти нужные для задания протеомы. Выбрала базу Proteomes, поставила фильтр Organism [OS] и ввела название своей бактерии Erysipelothrix larvae. Поиск выдал мне 1 результат. Протеом бактерии Erysipelothrix larvae референсный, состоящий из 2225 белков, ни один из которых не был добавлен из Swiss-Prot. Т.е. все данные проверялись автоматически, а не вручную, и гарантировать их правильность нельзя. Также вызвало опасение значение CPD: outlier (high value). Т.е. у этой бактерии белков сильно больше чем стандартное значение в этом таксоне. Вероятно, при получении протеома были допущены какие-то ошибки (например, попадание белков других бактерий), которые и привели к такому отклонению от стандартного значения. Также, возможно, значение CPD могло быть выше стандартного из-за того, что бактерия Erysipelothrix larvae является единственной среди рода Erysipelothrix устойчивой к мышьяку, хотя не думаю, что в таком случае значения отличались бы настолько кардинально.
В качестве бактерии, чей протеом будет выступать контрольным, была выбрана бактерия Erysipelothrix rhusiopathiae ATCC 19414 (ATCC 19414). Она также относится к роду Erysipelothrix, является более изученной и, что самое главное, не обладает устойчивостью к мышьяку. Протеом этой бактерии также референсный, содержащий 1644 белка, ни один из которых не был добавлен из Swiss-Prot. Значение CPD у данного протеома стандартное.
Erysipelothrix larvae
• Proteome ID: UP000063781
• Protein count: 2225
• CPD: Outlier (high value)(!!!)
• BUSCO: C:89% (S:89% D:0%) F:0% M:11%
• Белков из Swiss-Prot: 0
Erysipelothrix rhusiopathiae
• Proteome ID: UP000003028
• Protein count: 1644
• CPD: Standard
• BUSCO: C:87.6% (S:87.2% D:0.5%) F:0.9% M:11.5%
• Белков из Swiss-Prot: 0
Для скачивания протеомов были использованы следующие команды:
Для Erysipelothrix larvae: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000063781)' -O UP000063781.swiss.gz
Для Erysipelothrix rhusiopathiae: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000003028)' -O UP000003028.swiss.gz
2. Сравнение протеомов по представленности определенных групп белков
Erysipelothrix larvae
1. Трансмембранные белки
Запрос для поиска: (proteome:UP000063781) AND (ft_transmem:*)
Полученный ответ: 549
2. Ферменты
Запрос для поиска: (proteome:UP000063781) AND (ec:*)
Полученный ответ: 384
Erysipelothrix rhusiopathiae
1. Трансмембранные белки
Запрос для поиска: (proteome:UP000003028) AND (ft_transmem:*)
Полученный ответ: 439
2. Ферменты
Запрос для поиска: (proteome:UP000003028) AND (ec:*)
Полученный ответ: 574
Как говорилось ранее, Erysipelothrix larvae отличается от Erysipelothrix rhusiopathiae устойчивостью к мышьяку, так что в качестве третьего белка для сравнения был выбран белок, отвечающий за эту устойчивость. Статью по данной теме можно найти по данной ссылке. Я уже проводила похожее исследование в 1 семестре при написании мини-обзора, когда искала количество подобных белков у Erysipelothrix larvae средствами BASH(про это можно прочитать здесь). Сейчас же для поиска были использованы возможности Uniprot. В качестве белка для сравнения был использован ATPase, про него также можно прочитать тут.
Erysipelothrix larvae
Запрос для поиска: (taxonomy_id:1514105) AND (protein_name:ATPase)
Полученный ответ: 35
Интересно, что при подсчете ATPase в мини-обзоре результат вышел на 3 меньше, т.е. 32. Такая разница позволяет предположить то, что поиск в Uniprot является более точным.
Erysipelothrix rhusiopathiae
Запрос для поиска: (taxonomy_id:1648) AND (protein_name:ATPase)
Полученный ответ: 24
3. Сравнение протеомов по первой аминокислоте в каждом белке
Я решила проверить, правда ли, что первая аминокислота в каждом белке — метионин. Для этого я использовала BASH и следующий конвейер из команд:
zcat UP000063781.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | sort | uniq -c для Erysipelothrix larvae
Выдача: 2225 M
zcat UP000003028.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | sort | uniq -c для Erysipelothrix rhusiopathiae
Выдача: 1 I, 1643 M
Erysipelothrix larvae иллюстрирует стандартную ситуацию, когда первой аминокислотой является метионин. У Erysipelothrix rhusiopathiae же помимо метионина есть еще одна аминокислота — изолейцин. Возможно подобное исключение как-то связано с посттрансляционными модификациями.