В данной работе я буду работать с белком AAC07049.1. Он найден в бактерии Aquifex aeolicus. Белок называется рибонуклеаза 3. Она участвует в переваривании двухцепочечной РНК, в процессинге первичного транскрипта рРНК с образованием непосредственных предшественников больших и малых рРНК (23S и 16S). Также обрабатывает некоторые мРНК и тРНК, когда они кодируются в опероне рРНК. Вероятно, процессирует пре-крРНК и тракрРНК локусов CRISPR типа II, если они присутствуют в организме[1].
Aquifex aeolicus является хемоавтотрофной, грамотрицательной, подвижной, как правило, в форме стержня бактерией с приблизительной длиной 2.0-6.0μm и диаметром 0.4-0.5μm. Это один из немногих видов, принадлежащих типу Aquificae, который включает в себя несколько необычных видов термофильных бактерий, которых считают одними из древнейших бактерий.
Aquifex aeolicus лучше всего развивается в воде при температуре от 85 до 95 °C и обитает вблизи подводных вулканов и горячих источников. Для жизнедеятельности ей необходим кислород (хотя она может существовать и в среде с низким уровнем кислорода — до 7,5ppm). В процессе дыхания производит воду в качестве побочного продукта («Aquifex» означает «создающий воду»). Представители вида, как правило, образуют большие конгломераты, включающие в себя до 100 отдельных клеток. Они были обнаружены около островов к северу от Сицилии[2].
ID: RNC_AQUAE
AC: O67082
Name: Ribonuclease 3
Organism: Aquifex aeolicus (strain VF5)
TaxID:224324
PDB: 1I4S, 1JFZ, 1RC5, 1RC7, 1YYK, 1YYO, 1YYW, 1YZ9, 2EZ6, 2NUE, 2NUF, 2NUG, 4M2Z, 4M30
Length: 221 aa
Mass: 26100 Da
Белку Ribonuclease 3 соотсветсует 14 записей в PDB(база данных, включающая в себя все известные структуры белков).
ID: UniRef100
Length:221
Name:Ribonuclease 3
ID: UniRef90
Length:221
Name:Ribonuclease 3
ID: UniRef50
Length:221
Name:Ribonuclease 3
В каждом из кластеров белок является единственным аннотированным.
Протеом бактерии, который принадлежит исследуемый белок, является референсным с 1554 белками, 787 из которых, имеют записи в Swiss-Prot. Индификатор протеома: UP000000798.
В качестве близкого организма для сравнения протомов я решила взять Thermocrinis minervae (Индификатор протеома: UP000189810). Эти бактерии являются предстваителями одного семейства Aquificaceae. Их протеомы очень похожи, однако сами бактерии отличаются окислямыми продуктами: Thermocrinis minervae окисляет водород и серу[3], а Aquifex aeolicus - углекислый газ, водород и кислород[4].
При проверке BUSCO и CPD протеомов выяснилось, что количество потерянных и отсутвующих генов достаточно мало, что играет нам на руку, а значение CPD - Standard, для двух протеомов.
Степень изученности протеомов я определяла с помощью количества белков протеома в базе Swiss-Prot. Так, у Aquifex aeolicus их количество 787 (общее количество 1553 белка), а у Thermocrinis minervae они отсутвуют вовсе, несмотря на то, что в протеоме их 1463.
Запрос, который помог найти родственный протеом для сравнения:
https://www.uniprot.org/proteomes?query=(cpd:1)%20AND%20(proteome_type:1)%20AND%20(taxonomy_id:64898)
Команды для скачивания протеомов:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=((proteome:UP000000798))' -O UP000000798.swiss.gz
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=((proteome:UP000189810))' -O UP000189810.swiss.gz
Сравнивать протеомы я решила при помощи UniProt. Для этого ввела следующие запросы:
(proteome:UP000000798) AND (keyword:KW-0812)
(proteome:UP000189810) AND (keyword:KW-0812)
(proteome:UP000000798) AND (ec:*)
(proteome:UP000189810) AND (ec:*)
(proteome:UP000000798) AND (protein_name:sulfur)
(proteome:UP000189810) AND (protein_name:sulfur)
Я выбрала белки, содержащие серу, так как сера является отличительным продуктом в процесссе окислнения между бактериями.
Результаты получились следующими:
Организм | Количество трансмембранных белков | Доля трансмембранных белков | Количество ферментов | Доля ферментов | Количество белков, содержащих серу | Доля белков, содержащих серу |
Aquifex aeolicus(UP000000798) | 279 | 0.1795 | 479 | 0.3082 | 13 | 0.0084 |
Thermocrinis minervae(UP000189810) | 262 | 0.1791 | 407 | 0.2782 | 20 | 0.0137 |
Можно сделать вывод, что количнество и доля трансмембранных белков отличается незвачительно, а вот разница в количестве ферментов более 3%, что достаточно много. При этом белков с содержанием серы у Thermocrinis minervae, о чем и говорит описание бактерии.
В следующем сравнении я решила определить первую аминокислоту в белках протеомов. Для этого использовались следующие команды:
zcat UP000000798.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c
zcat UP000189810.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c
В протеоме Aquifex aeolicus все белки начинаются с метионина. А в протеоме Thermocrinis minervae один из белков начинается с глицина. Для того, чтобы сделать какой-то вывод об этом, я решила посмотреть описание белка с помощью команды:
zcat UP000189810.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^M' | grep -vB1 '^>' | less -S
Таким образом я узнала, что последовательность данного белка является "предварительной". Поэтому, вероятно, это компьютерная ошибка, а значит аномалией не является.
1. B. Lamontagne , S. Larose, J. Boulanger, S. A. Elela. The RNase III family: a conserved structure and expanding functions in eukaryotic dsRNA metabolism. Curr Issues Mol Biol. 2001 Oct;3(4):71-8. PMID: 11719970
2. Zhongjie Shi, Rhonda H. Nicholson, Ritu Jaggi, Allen W. Nicholson. Characterization of Aquifex aeolicus ribonuclease III and the reactivity epitopes of its pre-ribosomal RNA substrates. Nucleic Acids Res. 2011 Apr;39(7):2756-68. doi: 10.1093/nar/gkq1030. Epub 2010 Dec 7. PMID: 21138964 PMCID: PMC3074117 DOI: 10.1093/nar/gkq1030
3. G. Deckert, P. V. Warren, T. Gaasterland, W. G. Young, A. L. Lenox, D. E. Graham, R. Overbeek, M. A. Snead, M. Keller, M. Aujay, R. Huber, R. A. Feldman, J. M. Short, G. J. Olsen, R. V. Swanson. The complete genome of the hyperthermophilic bacterium Aquifex aeolicus. Nature. 1998 Mar 26;392(6674):353-8. doi: 10.1038/32831. PMID: 9537320.
4. Sara L. Caldwell, Yitai Liu, Isabel Ferrera, Terry Beveridge, Anna-Louise Reysenbach. Thermocrinis minervae sp. nov., a hydrogen- and sulfur-oxidizing, thermophilic member of the Aquificales from a Costa Rican terrestrial hot spring. Int J Syst Evol Microbiol. 2010 Feb;60(Pt 2):338-343. doi: 10.1099/ijs.0.010496-0. Epub 2009 Aug 3. PMID: 19651724