Практикум 8:UniProt Proteomes, EMBOSS

1. Выбор и скачивание протеомов

При выборе протеома, хорошор описывающего бактерию Mycolicibacterium madagascariense был использован поиск по Proteomes: Mycolicibacterium madagascariense, в результате которого был получен один результат. А так как у него CPD:standart и C:99.5% (S:98.8% D:0.7%) F:0.4% M:0.1% (а также известно 5669 белков), то я решил остановить свой выбор на нём. Скачивание проводилось по команде bash:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000466517)' -O UP000466517.swiss.gz

При выборе контрольного протеома был осуществлен поиск по Proteomes: Mycolicibacterium и отсортировано по CPD и BUSCO, после выбран референсный протеом организма Mycolicibacterium rhodesiae (strain NBB3) (Mycobacterium rhodesiae) (NBB3) (известно 6105 белков для него). Скачивание проводилось по команде bash:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000005442)' -O UP000005442.swiss.gz

2. Сравнение протеомов по представленности определенных групп белков

Сравнение проводилось по классам ферментов (Group by -> Enzyme class). Выдачи по запросам ((proteome:UP000466517) AND (ec:1.-.-.-)), по соответствующим протеому и классам, дают те же результаты.

Таблица 1. Сравнение представленности разных классов ферментов

M. madagascariense M. rhodesiae
Гидролазы 164 (19%) 157 (18%)
Изомеразы 45 (5%) 51 (6%)
Лигазы 82 (10%) 81 (9%)
Лиазы 93 (11%) 99 (11%)
Оксидоредуктазы 145 (17%) 145 (17%)
Трансферазы 294 (35%) 308 (35%)
Транслоказы 29 (3%) 30 (3%)
В сумме 852 871

Как видно из таблицы, данные протеомы обладают практически совпадающим соотношением ферментов по классам (не совпадают гидролазы, изомеразы, лигазы).

Для анализа количества трансмембранных белков были использованы следующие запросы:
(proteome: UP000466517) AND (keyword:Transmembrane)
(proteome: UP000005442) AND (keyword:Transmembrane)

Результат: 1032 и 1114 соответственно. Для исследуемого протеома это составляет 18,20% от всех белков, а для контрольного 18,25%.

Для данного пракума в качестве контрольного был выбран референсный для рода геном, поэтому качественные и количественные различия в белках незначительны, отличаются на 1-3 фермента. Для примера приведу такую функциональную группу, как биосинтез антибиотиков.
(proteome:UP000466517) AND (keyword:KW-0045)
(proteome:UP000005442) AND (keyword:KW-0045)
Результат: 3 и 2 белка соответветственно, что составляет меньше процента содержания в каждом протеоме. Совпадающим является только белок 2-oxoglutarate dioxygenase (ethylene-forming), обе записи имеют статус предсказано по гомологии.

3. Сравнение протеомов по первой аминокислоте

Используя команды bash и скачанные протеомы, было получено, что все белки протеомов, и для M. madagascariense, и для M. rhodesiae, начинаются с метионина (5669 и 6105 соответственно).

Используемые команды bash:
seqret -filter 'UP000005442.swiss:*[1:1]' | grep -v '>' | sort | uniq -c | less