учебная страничка маши смирновой

анализ протеома halobellus clavatus

1. поиск протеома, соответствующего геномной сборке

идентификатор сборки refseq: gcf_024498335.1

ncbi datasets genome: gcf_024498335.1

идентификатор сборки insdc: gca_024498335.1

при поисковом запросе (genome_assembly:gca_024498335.1) uniprot proteomes не выдал никакого результата, что означает, что данная сборка отсутствует в uniprot proteomes. поиск более ранних версий невозможен, так как изначально идентификатор указан с первой версией сборки.

отсутствие сборки возможно произошло из-за того, что:

2. поиск и скачивание референсного протеома

референсный протеом был удален, поэтому при расширенном поиске и введении в поисковую строку (taxonomy_id:1073986) and (proteome_type:1) появилась возможность выбрать наиболее близкий протеом. таковым оказался организм halobellus clavatus, proteome id: up000199170

команда для скачивания файла:

wget "https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome%3AUP000199170" -O UP000199170.swissprot.gz

3. оценка количества ферментов в протеоме

всего белков: 3,679

а) при поисковом запросе в uniprot proteomes (proteome:up000199170) and (ec:*) вышло 478 результатов.

б) при использовании bash и команды, подсчитывающей количество уникальных ферментативных функций (ec-номеров) в протеоме:

zcat UP000199170.swiss.gz| grep 'DE'| grep -c 'EC='

командная строка показала 495 результатов.

разница небольшая, и скорее всего она заключается в том, что uniprot считает только аннотированные белки, либо в том, что команда может завышать результат из-за повторяющихся ec-номеров в одном белке.

4. анализ протеома консольными средствами

архея, описанная в моем мини-обзоре обитала в гиперсоленых водоемах. логично предположить, что организация белков в различных компартментах организма могла подстроиться под среду обитания археи.

с помощью скрипта на bash:

zcat UP000199170.swiss.gz | grep -E '^(ID|KW)' | tr ';' '\n' | grep -E '^ID|membrane|cytoplasm|extracellular' -i | grep -A1 '^ID' | grep -v '^--' | paste - - | cut -f2 | grep -v '^ID' | sort | uniq -c | sort -nr

получаем распределение белков по компартментам клетки:

локализация количество
membrane 256
cell membrane 66
membrane (разные аннотации) 48
cytoplasm 8
cell inner membrane 5
cell membrane (разные аннотации) 5
membrane (разные аннотации) 4
membrane 2
cell membrane (разные аннотации) 2
cytoplasm (разные аннотации) 1
cell membrane (разные аннотации) 1

нетрудно заметить, что довольно большая часть белков сконцентрирована в части мембраны археи. именно за счет белков она могла:

что помогало ей выживать в экстремальных условиях.