Протеомы Uniprot
Объектом моего прошлого исследования была бактерия из семейства Halomonadaceae - Halomonas Venusta. В своей работе я выбрал один из протеомов бактерии Halomonas Venusta. Мой выбор пал на протеом UP000275808, так как он принадлежит к статусу «Другие», имеет небольшой процент мутаций и наиболее изучен. Количество вхождений - 3892. Оценка CPD - Standard. BUSCO: C:99.5% (S:99.4% D:0.2%) F:0% M:0.5%.
В качестве контрольного протеома был выбран протеон бактерии из того же семейства - Chromohalobacter canadensis - UP000219023. Контрольный протеом был выбран исходя из тех же критериев. Количество вхождений - 3282. Оценка CPD - Standard. BUSCO: C:99.5% (S:99.2% D:0.3%) F:0% M:0.5%
Команды для скачивания протеомов:
1. wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000275808' -O UP000275808.swiss.gz
2. wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000219023' -O UP000219023.swiss.gz
Команды, использованные для поиска количества различных функциональных групп в протеомах бактерий:
1.(proteome: Proteom_ID) AND (keyword:KW-0812) - для поиска количества трансмембранных белков.
Количество трансмембранных для Halomonas Venusta - 894, для Chromohalobacter canadensis - 737.
2. (proteome: Proteome_ID) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) - для поиска количества ферментов.
Количество ферментов для Halomonas Venusta - 944, для Chromohalobacter canadensis - 788.
(proteome:PROTEOM ID ) AND (keyword:KW-0324) - белки участвующие в гликолизе.
Количество белков участвующих в гликолизе для Halomonas Venusta - 16, для Chromohalobacter canadensis - 10.
Команда для получения упоминаний цинковых пальцев: 1. zcat UP000275808.swiss.gz|grep 'Zinc finger'|grep 'FT' |sort -u |wc -l
2. zcat UP000219023.swiss.gz|grep 'Zinc finger'|grep 'FT' |sort -u |wc -l
В протеоме Halomonas Venusta было выявлено 3 упоминания, в протеоме Chromohalobacter canadensis - 3 соответственно.