Практикум 8
В качестве протеома я выбрал протеом Vibrio nereis(UP000037515), который является референсным. Для контроля я использовал протеом Escherichia coli (strain K12)(UP000000625), который также является референсным. Для скачивания протеомов я использовал следующие команды:curl 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000000625)' > UP000000625.swiss.gz
Для скачивания протеома кишечной палочки
и
curl 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000037515)' > UP000037515.swiss.gz
для протеома Vibrio nereis
Сравнение протеомов
1) (proteome: Proteome ID) AND (keyword:KW-0812) - для поиска количества трансмембранных белков (0812=transmembrane)
2) (proteome: Proteome ID) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) - для поиска количества ферментов (ec:I, где I - класс )
3) (proteome: Proteome ID) AND (keyword:KW-0843) - для поиска фактора вирулентности (0843=virulence)
Результаты
Vibrio nereis(UP000037515)
Общее число белков = 3660
Трансмембранные белки = 860 (24%)
Ферменты = 946 (26%)
Вирулентность = 0
E.coli(K12)(UP000000625)
Общее число белков = 4401
Трансмембранные белки = 994 (23%)
Ферменты = 1713 (39%)
Вирулентность = 3
Сравнение протеомов по доп. критериям
Я решил сравнить цитируемость выбранных протеомов в статьях PubMed. Для этого я использовал следующие команды в bash:zgrep '^RX' UP000000625.swiss.gz | grep 'PubMed' | sort -u | wc -l
zgrep '^RX' UP000037515.swiss.gz | grep 'PubMed' | sort -u | wc -l
Результаты оказались вполне закономерными - цитируемость бактерии Vibrio nereis оказалась равна нулю (ввиду её нулевой вирулентности) , а цитируемость в статьях достаточно важной для организма бактерии кишечной палочки(E.Coli K12) оказалась равна 9654.