UniProt Proteomes

1. Выбор и скачивание протеомов

Для выполнения данного задания я выбрала уже рассматриваемую в предыдущих практикумах бактерию Enterococcus lactis, а именно ее протеом с ID UP000531895. Выбор пал на этот протеом, так как он:

-принадлежит к статусу "Другие", что удовлетворяет критерию выбора.

-имеет меньший процент мутаций в сравнении с другими протеомами

-по нему можно найти сравнительно много информации для выполнения задания

В качестве контрольного протеома был выбран протеом с ID UP000000805, принадлежащий архее Methanocaldococcus jannaschii. Выбор пал на эту архею, так как среди родственных бактерии E. lactis организмов я не смогла найти объект, отличающийся по функциям и протеому так, чтобы он удовлетворял условию задания для дальнейшего анализа и сравнения протеомов (либо оба организма патогенные, либо у подходящего организма не обраружилось референсного или другого протеома). Данный протеом был выбран по тем же условиям, что и UP000531895

Ниже приведено сравнение протеомов

photo photo

Рисунок 1.BUSCO протеома UP000531895

photo

Рисунок 2.BUSCO протеома UP000000805

Для скачиваия файлов с протеомами были использованы следующие команды:

1) wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(Proteomes ID: UP000531895)' -O UP000531895.swiss.gz

2) wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(Proteomes ID: UP000000805)' -O UP000000805.swiss.gz

2. Сравнение протеомов

Команды, использованные для поиска количества различчных функциональных групп в протеомах бактерии и археи:

1) (proteome: Proteome ID) AND (keyword:KW-0812) - для поиска количества трансмембранных белков [0812=transmembrane]

2) (proteome: Proteome ID) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) - для поиска количества ферментов [ec:I, где I - класс фермента]

3) (proteome: Proteome ID) AND (keyword:KW-0843) - для поиска фактора вирулентности [0843=virulence]

В качестве третьего параметра сравнения протеомов я выбрала параметр вирулентности, так как выбранная бактерия является патогенным организмом, а архея - нет. Из результатов запроса по базе UniProtKB можно в этом убедиться:

Протеом Enterococcus lactis:

Proteome ID: UP000531895

Трансмембранные белки: 648

Ферменты: 576

Вирулентность: 2

Протеом Methanocaldococcus jannaschii:

Proteome ID: UP000000805

Трансмембранные белки: 294

Ферменты: 590

Вирулентность: 0

3. Сравнение протеомов по дополнительным критериям

Еще одним критерием сравнения я выбрала цитируемость в статьях PubMed. Для этого были использованы команды:

zgrep '^RX' UP000531895.swiss.gz | grep 'PubMed' | sort -u | wc -l для протеома бактерии Enterococcus lactis

zgrep '^RX' UP000000805.swiss.gz | grep 'PubMed' | sort -u | wc -l для протеома археи Methanocaldococcus jannaschii

После выполнения данных команд цитируемость в статьях PubMed для протеома бактерии составила 0, а для археи - 328. Это говорит о том, что протеом археи вероятнее всего лучше аннотирован, чем протеом бактерии. Это также подтверждается статусом протеомов: Reference для контрольного протеома UP000000805 и Other для UP000531895.