Практикум 8

1. Выбор и скачивание протеомов.

В качестве первого протеома был выбран протеом бактерии Succinivibrio dextrinosolvens, единственный протеом найден по названию рода с помощью расширенного поиска. Данный протеом является референсным.

В качестве протеома для сравнения был выбран протеом бактерии Succinatimonas hippei, находящейся в одном семействе Succinivibrionaceae с бактерией Succinivibrio dextrinosolvens. Данная бактерия интересна тем, что была выделена из организма домашних животных и человека, и в небольших популяциях способна распростаранять патогены. Выбранный протеом также является референсным.

Общая информация о протеомах и степень изученности:

1.Succinivibrio dextrinosolvens DSM 3072
ID: UP000242432
Количество белков: 2306
Swiss-prot: 0
CPD: Unknown
BUSCO: C:88% (S:86.3% D:1.6%) F:0.8% M:11.2%

2.Succinatimonas hippei (strain DSM 22608 / JCM 16073 / KCTC 15190 / YIT 12066)
ID: UP000018458
Количество белков: 2169
Swiss-prot: 1
CPD: Full
BUSCO: C:88.5% (S:87.7% D:0.8%) F:1.6% M:9.8%

В первом протеоме ни один белок не занесен в базу Swiss-prot, кроме того, показатель CPD неизвестен. По данному протеому нет ни одной публикации, следовательно он изучен мало. Несмотря на это у него хороший показатель BUSCO, что не может не радовать (достаточно высокий процент однокопийных ортологов).

Во втором протеоме есть единственный белок, занесенный в базу Swiss-prot. Показатель CPD также неизвестен, однако показатель BUSCO более высоко качества. К сожалению, найти более изученный протеом у бактерии данного семейства мне не удалось, поэтому я решила остановится на протеоие имеено этой бактерии.

Команды для скачивания протеомов:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=((proteome:UP000242432))' -O UP000242432.swiss.gz

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=((proteome:UP000018458))' -O UP000018458.swiss.gz

Сравнение протеомов по представленности определенных групп белков

Группа белков Succinivibrio dextrinosolvens Succinatimonas hippei
Количество трансмембранных белков 451 444
Количество ферментов 478 457
Количество флагеллина 46 0

При поиске трансмембранных белков с помощью расширенного поиска в базе Uniprot c помощью запроса (proteome:UP000242432(UP000018458)) AND (keyword:Transmembrane[KW-0812]) было найдено 451 и 444 белков соответственно. Аналогичные числа были получены с помощью командной строки bash и конвейера zgrep 'KW' UP000018458.swiss.gz(UP000242432.swiss.gz) | grep 'Transmembrane {' | wc -l

Для поиска ферментов использовался расширенный поиск в базе Uniprot: (proteome:UP000242432(UP000018458)) AND (ec:*).

Одной из отличительных особенностей бактерии Succinatimonas hippei является отсутствие жгутика, в то время как у бактерии Succinivibrio dextrinosolvens есть изогнутый, спирально закрученный однополярный жгутик, который состоит из белка флагеллина. Чтобы узнать количество этого белка был использован конвейр bash: zgrep 'KW' UP000242432.swiss.gz(UP000018458.swiss.gz) | grep 'flagellum' | wc -l

Сравнение протеомов по ...

Достоверность существования белков

С помощью конвейера zgrep '^PE' UP000242432.swiss.gz (UP000018458.swiss.gz) | sort -u выяснилось, что в протеоме бактерии Succinatimonas hippei есть белки, достоверность существования которых основывается "на белковом уровне" (1 уровень), в то время как в протеме бактерии Succinivibrio dextrinosolvens максимальный уровень достоверности 2 (основываясь на транскрипции). Таким образом, ипользуя конвейер zgrep '^PE' UP000018458.swiss.gz | grep 'Predicted' | wc -l для различный уровней достоверности существования, были получены следующие данные:

Уровень достоверности Succinivibrio dextrinosolvens Succinatimonas hippei
1: Evidence at protein level 0 (0%) 1 (0,046%)
2: Evidence at transcript level 2 (0,08%) 2 (0,09%)
3: Inferred from homology 1106 (47,96%) 1057 (48,73%)
4: Predicted 1198 (51,95%) 1109 (51,13%)

Из этих данных можно сделать вывод, что несмотря на референсность обоих протеомов, уровень достоверности выше у протеома бактерии Succinatimonas hippei, хотя и не значительно.

Так же интересно, что ни у одного из белков обоих протеомов нет 3D структур. Белки протеома бактерии Succinatimonas hippei были добавлены в 2011 году в базу TrEMBLE, и 1 в 2017, когда создавалась основная аннотаци для протеома бактерии Succinivibrio dextrinosolvens.