Практикум 8

В качестве протеома я выбрал протеом Vibrio nereis(UP000037515), который является референсным. Для контроля я использовал протеом Escherichia coli (strain K12)(UP000000625), который также является референсным. Для скачивания протеомов я использовал следующие команды:

curl 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000000625)' > UP000000625.swiss.gz
Для скачивания протеома кишечной палочки
и
curl 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000037515)' > UP000037515.swiss.gz
для протеома Vibrio nereis

Сравнение протеомов


1) (proteome: Proteome ID) AND (keyword:KW-0812) - для поиска количества трансмембранных белков (0812=transmembrane)

2) (proteome: Proteome ID) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) - для поиска количества ферментов (ec:I, где I - класс )

3) (proteome: Proteome ID) AND (keyword:KW-0843) - для поиска фактора вирулентности (0843=virulence)

Результаты


Vibrio nereis(UP000037515)

Общее число белков = 3660

Трансмембранные белки = 860 (24%)

Ферменты = 946 (26%)

Вирулентность = 0



E.coli(K12)(UP000000625)

Общее число белков = 4401

Трансмембранные белки = 994 (23%)

Ферменты = 1713 (39%)

Вирулентность = 3

Сравнение протеомов по доп. критериям

Я решил сравнить цитируемость выбранных протеомов в статьях PubMed. Для этого я использовал следующие команды в bash:

zgrep '^RX' UP000000625.swiss.gz | grep 'PubMed' | sort -u | wc -l

zgrep '^RX' UP000037515.swiss.gz | grep 'PubMed' | sort -u | wc -l

Результаты оказались вполне закономерными - цитируемость бактерии Vibrio nereis оказалась равна нулю (ввиду её нулевой вирулентности) , а цитируемость в статьях достаточно важной для организма бактерии кишечной палочки(E.Coli K12) оказалась равна 9654.