Исследование протеомов бактерий

1. Выбор и скачивание протеомов
Для бактерии Methylovorus glucosetrophus (strain SIP3-4) я выбрала референсный протеом (Proteome ID: UP000002743) из 2907 белков. CPD и BUSCO сомнений не оставляют, так количество белков чуть выше среднего среди родственнх групп, и большинство генов белков представлены в виде единственной копии.
Я хотела в противовес своей метилотрофной бактерии поставить того, кто не использует метил для дыхания. Выбор пал на хемолитоавтотрафа, который берет энергию из неорганических соединений, а моя бактерия – из метила. Обе бактерии входят в порядок Nitrosomonadales.
Протеом сравнения (Proteome ID: UP000001416) выделен из бактерии Nitrosomonas europaea (strain ATCC 19718 / CIP 103999 / KCTC 2705 / NBRC 14298), он насчитывает 2375 белков. CPD и BUSCO сомнений не оставляют, так количество белков такое же, как и у родственнх групп, и большинство генов белков представлены в виде единственной копии.
Для скачивания протеомов были введены команды:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000002743)' -O AC.swiss.gz
mv AC.swiss.gz UP000002743.swiss.gz
		
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000001416)' -O AC.swiss.gz
mv AC.swiss.gz UP000001416.swiss.gz
2. Сравнение протеомов по представленности определенных групп белков
Подсчет трансмембранных белков:
  1. zcat UP000002743.swiss.gz |grep '^KW'|grep 'Transmembrane'|wc -l = 1265
  2. zcat UP000001416.swiss.gz |grep '^KW'|grep 'Transmembrane'|wc -l = 974
При подсчете количества ферментов в каждом протеоме я решила узнать количество в каждом классе:
  1. Для первого протеома (proteome:UP000002743) AND (ec:*) 92+273+135+67+47+61+22=697
  2. Для второго протеома (proteome:UP000001416) AND (ec:*) 116+250+156+64+40+66+34=726
В качестве специфической функциональной группы ферментов я решила выбрать Метилтрансферазы (2.1.1):
  1. (proteome:UP000002743) AND (ec:2.1.1.-) = 42
  2. (proteome:UP000001416) AND (ec:2.1.1.-) = 38
Результаты поиска удовлетворяют изначальной гипотезе о том, что у метилотрофной бактерии будет больше ферментов, которые переносят моноуглеродные лиганды.
3. Сравнение протеомов по количеству плазмидных белков
Интересно было как много белков у каждой бактерии кодируется на плазмиидах. Для этого использовался поиск (proteome:UP00000*) AND (plasmid:*), который для M. glucosetrophus выдал 92 результата, хотя в таблице особенностей бактерии есть данные о 172 белках, закодированных на плазмидах, в то время как для N. europaea запрос в UniProtKB не выдал ничего. Этот результат показался очень сомнительным, поэтому я проверина на NCBI, есть ли у нее плазмиды. Оказалось, что есть две, и на них располагается 3 белка. Ссылка на полный геном.
Из этого мини-исследования можно сдлеать вывод о том, что протеом M. glucosetrophus аннотирован гораздо лучше, чем у N. europaea.