Практикум 8

Задание 1. Поиск протеома, соответствующего геномной сборке

В мини-обзоре для бактерии Xylophilus rhododendri использовалась геномная сборка NCBI RefSeq GCF_009906855.1

Ссылка на страницу сборки в базе NCBI Datasets Genome

- Идентификаторы геномной сборки для бактерии Xylophilus rhododendri

в RefSeq: GCF_009906855.1

в INSDC: GCA_009906855.1

- Поисковый запрос по UniProt Proteomes, который выдал протеом: (genome_assembly:GCA_009906855.1)

- Идентификатор протеома: UP000464787

- Статус протеома: референсный

Задание 2. Поиск и скачивание референсного протеома

Для бактерии Xylophilus rhododendri протеом UP000464787 является референсным, поэтому он был взят для выполнения дальнейших заданий.

Поисковый запрос для этого протеома в UniProt Proteomes: (taxonomy_id:2697032) AND (proteome_type:1).

Для скачивания белковой записи, принадлежащей выбранному протеому была использована команда:

curl 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000464787)' > UP000464787.swiss.gz

Задание 3. Оценка числа белков, содержащих альфа-спирали

1. Записи с ключом HELIX:

Конвейер в bash: zgrep -e '^FT *HELIX' -e '^ID' UP000464787.swiss.gz | grep -B1 'HELIX' | grep '^ID' | wc -l

Результат: 0 записей

2. Записи с ключом TRANSMEM:

Конвейер в bash: zgrep -e '^FT *TRANSMEM' -e '^ID' UP000464787.swiss.gz | grep -B1 'TRANSMEM' | grep '^ID' | wc -l

Результат: 883 записи

Результаты расходятся с представлением о том, что альфа-спирали формируют большинство трансмембранных участков.

Отсутствие записей с альфа-спиралями может указывать на недостаточную изученность протеома бактерии.

Задание 4. Оценка количества ферментов в протеоме

1. По запросу: (proteome:UP000464787) AND (ec:*)

для протеома UP000464787 было получено 938 белков, которые потенциально могут обладать каталитической активностью.

Доля таких белков составляет примерно 20% всего протеома.

2. По запросу: (proteome:UP000464787) AND ((keyword:KW-0378) OR (keyword:KW-0560) OR (keyword:KW-0808) OR (keyword:KW-0456) OR (keyword:KW-0413) OR (keyword:KW-0436) OR (keyword:KW-1278))

для протеома UP000464787 было получено 1699 белков, которые могут являться ферментами.

Такие белки составляют примерно 32,5% всего протеома.

В результате анализа двумя поисковыми запросами были получены различающиеся оценки количества ферментов. Оценка по EC-номерам является менее точной, поскольку не у всех ферментов может быть EC-номер в записи UniProtKB. Оценка по ключевому слову (класс фермента) точнее из-за того, исключает белки с неферментативной функцией.