Сравнение протеомов Tatumella ptyseos и Tatumella morbirosei.

1. При выборе протеома родственного Tatumella citrea которому также принадлежит мой белок DsbD я использовала запрос в UniProtKB:(taxonomy_id:82986) AND (uniref_cluster_50:UniRef50_Q66FE1). В запросе обнаружилась как раз Tatumella morbirosei. Это грамотрицательная бактерия, которая имеет самую продуктивную цианофицинсинтетазу1(CphA 1), которая продуцирает цианофицин - биополимер, для производства пластмасс[1].

Второй протеом я искала по запросу в Proteomes (taxonomy_id:82986) (по роду Tatumella). В результате выдало два референсных протеома Tatumella ptyseos и Tatumella morbirosei, таким образом я выбрала контрольным - Tatumella ptyseos. Эта бактерия, в свою очередь, тоже грамотрицательная (Enterobacteriaceae) и дважды стала причиной инфекции человека в Бразилии[2]. На этом основано различие, которое я приняла во внимание при сравнении протеомов данных бактерий.

Данные BUSCO для Tatumella ptyseos: C:99.1% (S:98.9% D:0.2%) F:0.9% M:0%(сравнение по ортолгичным группам генов), для Tatumella morbirosei: C:98.4% (S:98% D:0.5%) F:0% M:1.6%.

CPD: Tatumella ptyseos - Close to standard (low value), Tatumella morbirosei - Standard.

UniProt: Reference proteome Tatumella ptyseos(Proteome ID:UP000028602, число белков в базе Swiss-Prot: 3337), а также: Reference proteome Tatumella morbirosei(Proteome ID:UP000029577, число белков в базе Swiss-Prot: 3697)

Скачивание протеомов происходило через команду :

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP*' -O *.swiss.gz

2.1 Далее для подсчёта колчиества трансмембранных белков использовалась команда:

zcat UP*.swiss.gz |grep '^KW'|grep 'Transmembrane'|wc -l

Для Tatumella ptyseos получилось 1369 (от общего количества белков: 40,02%), для Tatumella morbirosei - 1565 (от обшего числа белков: 42,33%).

2.2 Далее для подсчёта количества ферментов я искала в колонке DE слова с окончанием на 'ase'. Была использована команда:

zcat UP*.swiss.gz |grep '^DE'|grep 'RecName: Full='|grep -i '[a-z]ase'|wc -l

Для того чтобы 'ase' было в конце слова, а перед ним было любое количество букв независимо от регистра, я использовала опцию -i и в grep поставила '[a-z]'. Итого у Tatumella ptyseos получилось - 971 (29,1% от общего числа белков), для Tatumella morbirosei - 1101 (29,78% от общего числа белков).

2.3 Третим критерием для сравнения был выбран фактор вирулентности, так как выше я ссылалась на статью, которая утверждала что Tatumella ptyseos была причиной инфекций человека. Однако было зарегеcтрировано всего два случая инфицирования, всявязи с чем могу предположить, что факторов вирулентности будет немного. Итак, подсчёт вёлся с помощью следующей команды:

zcat UP*.swiss.gz |grep '^KW'|grep 'Virulence'|wc -l

У Tatumella ptyseos - 3 (0,09% от всех белков), у Tatumella morbirosei - 1 (0,03% от всех белков). В принципе, мое предположение подтвердилось, и факторов вирулентности у Tatumella ptyseos очень мало, но все таки больше, чем у Tatumella morbirosei.

3. Далее я решила проверить все ли белки в протеомаъ начинаются с метионина. Для этого был использован Bash:

zgrep '^SQ' UP000029577.swiss.gz -A1|grep -v '^SQ'|grep -v '^--'|tr -d ' '|cut -b1|sort|uniq -c

Поясение к команде: Сначала были вырезаны строки начинающиемся с SQ, там хранится информация о последовательности белка(опция -А1 чтобы печатать одну строку после основной, -v чтобы печатать все кроме заданного). Далее были вырезаны строки начинающиеся с --, а после удалены пробелы, а далее были вырезаны, отсортированы и посчитаны первые аминоксилоты в каждом белке каждого протеома.

Таким образом я получила для Tatumella ptyseos интереcные результаты: M-3316, A,D -2, C,E,G,I,K,L-1. Для Tatumella morbirosei: M - 3697. То есть у одной из моих бактерий есть альтернативные старт-кодоны. Причин может быть несколько: антикодон на тРНК может быть частично комплементарен кодону на иРНК(то есть может быть несколько антикодонов к одному кодону), также некоторые кодоны, называемые "слабыми", в совокупности с последовательностями Шайна-Дальгарно могут инициировать синтез белка, и, наконец, посттрансляционные модификации могут удалять метионин из последовательности. Все это могло привести к такому разнообразию первых кодонов в белках Tatumella ptyseos.

[1] Kyle Swain, Itai Sharon, Wyatt Blackson, Stefan Tekel, T. Martin Schmeing, David R. Nielsen, Brent L. Nannenga.Heterologous production of cyanophycin with Tatumella morbirosei cyanophycin synthetase

[2] Paulo Sérgio Gonçalves da Costa,Juliana Monteiro de Castro Mendes,Geyza Machado Ribeiro.Tatumella ptyseos causing severe human infection: report of the first two Brazilian cases.