Так как в базе Proteomes не оказалось протеома бактерии, про которую я делал обзор, мне пришлось выбрать протеом Peteryoungia ipomoeae, принадлежащий представителю того же рода. Протеом Peteryoungia ipomoeae является единственным в базе Proteomes, принадлежащий роду Peteryoungia, поэтому в качестве контрольного я решил взять хорошо аннотированный протеом Mycoplana dimorpha, принадлежащий представителю того же семейства Rhizobiaceae.
Proteome ID: UP000308828
Protein count: 4087
CPD: Close to standard (low value)
BUSCO: C:99.5% (S:99.5% D:0%) F:0.2% M:0.3%
Белков из Swiss-Prot: 0
Proteome ID: UP000241247
Protein count: 4217
CPD: Close to standard (low value)
BUSCO: C:99.8% (S:99.4% D:0.5%) F:0.2% M:0%
Белков из Swiss-Prot: 2
Второй протеом изучем гораздо лучше первого: в нём имеется 1 белок с Annotation score 5 и 2 белка со статусом Reviewed из базы Swiss-Prot. Количество белков в обехи бактериях примерно одинаковое, что не удивительно, поскольку они принадлежат к одному семейству. Также это свидетельствует о том, что не было допущено серьёзных ошибок при получении протеома менее изученной Peteryoungia ipomoeae.
Для скачивания протеомов были использованы следующие команды:
Peteryoungia ipomoeae: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000308828)' -O UP000308828.swiss.gz
Mycoplana dimorpha: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000241247)' -O UP000241247.swiss.gz
Трансмембранные белки: 846
Запрос: (proteome:UP000308828) AND (ft_transmem:*)
Ферменты: 783
Запрос: (proteome:UP000308828) AND (ec:*)
Трансмембранные белки: 858
Запрос: (proteome:UP000241247) AND (ft_transmem:*)
Ферменты: 718
Запрос: (proteome:UP000241247) AND (ec:*)
Количество трансмембранных белков и ферментов не существенно различается, что демонстрируют результаты.
Известно, что некоторые бактерии из семейства Rhizobiaceae обладают способностью усиливать или затруднять рост растений. Более того, многие виды в этом семействе являются диазотрофами, способными фиксировать азот, и формируют симбиотические отношения растениями.
Нитрогеназы: 1 (proteome:UP000308828) AND (protein_name:Nitrogenase)
Нитрогеназы: 0 (proteome:UP000241247) AND (protein_name:Nitrogenase)
Как показывают результаты, Peteryoungia ipomoeae имеет 1 нитрогеназу. В то время как у Mycoplana dimorpha нет ни одной нитрогеназы. Таким образом, можно сделать вывод, что только Peteryoungia ipomoeae может фиксировать азот.
С целью подтвердить, является ли метионин первой аминокислотой в каждом белке, я решил применить команды BASH и написал следующий конвеер:
Peteryoungia ipomoeae: zcat UP000308828.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c
Mycoplana dimorpha: zcat UP000241247.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c
Результаты оказались следующие:Первые сминокислоты в белке: 2 C, 3 L, 4081 M, 1 T
Первые сминокислоты в белке: 1 D, 2 G, 4210 M, 1 N, 1 P, 1 R, 1 V
Ожидаемо наиболее распространённой стартовой аминокислотой является метионин, однако у обоих видов встречаются и другие, что может быть связанно с посттрансляционными модификациями