При выборе протеома, хорошор описывающего бактерию Mycolicibacterium madagascariense был использован поиск по Proteomes: Mycolicibacterium madagascariense, в результате которого был получен один результат.
А так как у него CPD:standart и C:99.5% (S:98.8% D:0.7%) F:0.4% M:0.1% (а также известно 5669 белков), то я решил остановить свой выбор на нём.
Скачивание проводилось по команде bash:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000466517)' -O UP000466517.swiss.gz
При выборе контрольного протеома был осуществлен поиск по Proteomes: Mycolicibacterium и отсортировано по CPD и BUSCO, после выбран референсный протеом организма Mycolicibacterium rhodesiae (strain NBB3) (Mycobacterium rhodesiae) (NBB3) (известно 6105 белков для него).
Скачивание проводилось по команде bash:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000005442)' -O UP000005442.swiss.gz
Сравнение проводилось по классам ферментов (Group by -> Enzyme class). Выдачи по запросам ((proteome:UP000466517) AND (ec:1.-.-.-)), по соответствующим протеому и классам, дают те же результаты.
Таблица 1. Сравнение представленности разных классов ферментов
M. madagascariense | M. rhodesiae | |
Гидролазы | 164 (19%) | 157 (18%) |
Изомеразы | 45 (5%) | 51 (6%) |
Лигазы | 82 (10%) | 81 (9%) |
Лиазы | 93 (11%) | 99 (11%) |
Оксидоредуктазы | 145 (17%) | 145 (17%) |
Трансферазы | 294 (35%) | 308 (35%) |
Транслоказы | 29 (3%) | 30 (3%) |
В сумме | 852 | 871 |
Как видно из таблицы, данные протеомы обладают практически совпадающим соотношением ферментов по классам (не совпадают гидролазы, изомеразы, лигазы).
Для анализа количества трансмембранных белков были использованы следующие запросы:
(proteome: UP000466517) AND (keyword:Transmembrane)
(proteome: UP000005442) AND (keyword:Transmembrane)
Результат: 1032 и 1114 соответственно. Для исследуемого протеома это составляет 18,20% от всех белков, а для контрольного 18,25%.
Для данного пракума в качестве контрольного был выбран референсный для рода геном, поэтому качественные и
количественные различия в белках незначительны, отличаются на 1-3 фермента. Для примера приведу такую
функциональную группу, как биосинтез антибиотиков.
(proteome:UP000466517) AND (keyword:KW-0045)
(proteome:UP000005442) AND (keyword:KW-0045)
Результат: 3 и 2 белка соответветственно, что составляет меньше процента содержания в каждом протеоме.
Совпадающим является только белок 2-oxoglutarate dioxygenase (ethylene-forming), обе записи имеют статус предсказано по гомологии.
Используя команды bash и скачанные протеомы, было получено, что все белки протеомов, и для M. madagascariense, и для M. rhodesiae, начинаются с метионина (5669 и 6105 соответственно).
Используемые команды bash:
seqret -filter 'UP000005442.swiss:*[1:1]' | grep -v '>' | sort | uniq -c | less