1. Выбор и скачивание протеомов.
В качестве первого протеома был выбран протеом бактерии Succinivibrio dextrinosolvens, единственный протеом найден по названию рода с помощью расширенного поиска. Данный протеом является референсным.
В качестве протеома для сравнения был выбран протеом бактерии Succinatimonas hippei, находящейся в одном семействе Succinivibrionaceae с бактерией Succinivibrio dextrinosolvens. Данная бактерия интересна тем, что была выделена из организма домашних животных и человека, и в небольших популяциях способна распростаранять патогены. Выбранный протеом также является референсным.
1.Succinivibrio dextrinosolvens DSM 3072
ID: UP000242432
Количество белков: 2306
Swiss-prot: 0
CPD: Unknown
BUSCO: C:88% (S:86.3% D:1.6%) F:0.8% M:11.2%
2.Succinatimonas hippei (strain DSM 22608 / JCM 16073 / KCTC 15190 / YIT 12066)
ID: UP000018458
Количество белков: 2169
Swiss-prot: 1
CPD: Full
BUSCO: C:88.5% (S:87.7% D:0.8%) F:1.6% M:9.8%
В первом протеоме ни один белок не занесен в базу Swiss-prot, кроме того, показатель CPD неизвестен. По данному протеому нет ни одной публикации, следовательно он изучен мало. Несмотря на это у него хороший показатель BUSCO, что не может не радовать (достаточно высокий процент однокопийных ортологов).
Во втором протеоме есть единственный белок, занесенный в базу Swiss-prot. Показатель CPD также неизвестен, однако показатель BUSCO более высоко качества. К сожалению, найти более изученный протеом у бактерии данного семейства мне не удалось, поэтому я решила остановится на протеоие имеено этой бактерии.
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=((proteome:UP000242432))' -O UP000242432.swiss.gz
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=((proteome:UP000018458))' -O UP000018458.swiss.gz
Группа белков | Succinivibrio dextrinosolvens | Succinatimonas hippei |
---|---|---|
Количество трансмембранных белков | 451 | 444 |
Количество ферментов | 478 | 457 |
Количество флагеллина | 46 | 0 |
При поиске трансмембранных белков с помощью расширенного поиска в базе Uniprot c помощью запроса (proteome:UP000242432(UP000018458)) AND (keyword:Transmembrane[KW-0812]) было найдено 451 и 444 белков соответственно. Аналогичные числа были получены с помощью командной строки bash и конвейера zgrep 'KW' UP000018458.swiss.gz(UP000242432.swiss.gz) | grep 'Transmembrane {' | wc -l
Для поиска ферментов использовался расширенный поиск в базе Uniprot: (proteome:UP000242432(UP000018458)) AND (ec:*).
Одной из отличительных особенностей бактерии Succinatimonas hippei является отсутствие жгутика, в то время как у бактерии Succinivibrio dextrinosolvens есть изогнутый, спирально закрученный однополярный жгутик, который состоит из белка флагеллина. Чтобы узнать количество этого белка был использован конвейр bash: zgrep 'KW' UP000242432.swiss.gz(UP000018458.swiss.gz) | grep 'flagellum' | wc -l
С помощью конвейера zgrep '^PE' UP000242432.swiss.gz (UP000018458.swiss.gz) | sort -u выяснилось, что в протеоме бактерии Succinatimonas hippei есть белки, достоверность существования которых основывается "на белковом уровне" (1 уровень), в то время как в протеме бактерии Succinivibrio dextrinosolvens максимальный уровень достоверности 2 (основываясь на транскрипции). Таким образом, ипользуя конвейер zgrep '^PE' UP000018458.swiss.gz | grep 'Predicted' | wc -l для различный уровней достоверности существования, были получены следующие данные:
Уровень достоверности | Succinivibrio dextrinosolvens | Succinatimonas hippei |
---|---|---|
1: Evidence at protein level | 0 (0%) | 1 (0,046%) |
2: Evidence at transcript level | 2 (0,08%) | 2 (0,09%) |
3: Inferred from homology | 1106 (47,96%) | 1057 (48,73%) |
4: Predicted | 1198 (51,95%) | 1109 (51,13%) |
Из этих данных можно сделать вывод, что несмотря на референсность обоих протеомов, уровень достоверности выше у протеома бактерии Succinatimonas hippei, хотя и не значительно.
Так же интересно, что ни у одного из белков обоих протеомов нет 3D структур. Белки протеома бактерии Succinatimonas hippei были добавлены в 2011 году в базу TrEMBLE, и 1 в 2017, когда создавалась основная аннотаци для протеома бактерии Succinivibrio dextrinosolvens.