Сравнение протеомов Lactobacillus agilis и Escherichia coli

Таблица 1. Характеристики протеомов
Характеристика Lactobacillus agilis Escherichia coli
ID протеома UP000051008 UP000000625
Количество белков 1,951 4,391
Количество белков в Swiss-Prot 0 4389
Запрос annotation:(type:transmem) AND proteome:up000051008 annotation:(type:transmem) AND proteome:up000000625
Количество белков (в Swiss-Prot) 403(0) 946(946)
Запрос ec:* AND proteome:up000051008 ec:* AND proteome:up000000625
Количество белков(в Swiss-Prot) 397(0) 1676(1676)
Запрос annotation:(type:function *teichoic*) AND proteome:up000000625 annotation:(type:function *teichoic*) AND proteome:up000051008
Количество белков(в Swiss-Prot) 3(0) 0(0)

Для начала стоит отметить, что из-за большой разницы (в несколько раз) в числе белков сравниваемых бактерий использовать в анализе абсолютные значения количеств нерационально, а значит имеет смысл составить Таблицу 2:

Таблица 2. Доли групп белков
Признак группы Lactobacillus agilis Escherichia coli
Трансмембранные 20,66% 21,55%
Ферменты 20,35% 38,17%
Функция связана с трейхоевыми кислотами 0,15% 0

Теперь можно проанализировать полученные данные.

При просмотре таблицы 2 можно заметить, что доля трансмембранных белков в протеомах обеих бактерий примерна одинакова (отличие всего на 0,89%), что удивительно, учитывая, что L. agilis является грамположительной бактерией, а E. coli - грамотрицательной, из-за чего можно было ожидать большего превосходства по числу белков у E. coli.

Объясниь это можно так: в данном случае разнообразие белков E. coli может не распространяться на трансмембранные, а значит и использование при анализе данных относительных значений было ошибочным. При сравнении абсолютных значений разница налицо - в 2,4 раза.

Альтернативным объяснением несовпадения теоретических умозаключений и практически полученных данных может быть то, что более развитая поверхность мембран E. coli (а у грамотрицательных бактерий их две) вовсе не подразумевает соответственное увеличение числа трансмембранных белков, а сама эта зависимость сомнительна и требует дальнейшего сопоставления числа трансмембранных белков у грамположительных и грамотрицательных бактерий.

Наконец, еще одним объяснением может быть банальная нехватка данных о протеоме L. agilis: для этой бактериии нет рецензированных белков, даже несмотря на то, что фигурирующий в исследовании протеом вляется референсным; а значит под сомнение можно поставить полученные даннные: возможно, среди белков есть, например, повторяющиеся.

По моему мнению наиболее вероятно первое объяснение: количество функций трансмембраных белков, а значит и их разнообразие, не может быть прямо пропорционально размеру протеома организма, так как двум разным мембранам (как у грамотрицательной E. coli) соответствуют разные их свойства, а значит и большее разнообразие находящихся в них белков, чем у гипотетической грамположительной бактерии с тем же числом белков, но относительное число трансмембранных белков может быть такое же, как у грамположительной бактерии с меньшим протеомом за счет большего разнообразия других протеинов.

А вот преобладание доли ферментов ото всех белков в E. coli может быть объяснено ее более широким распрстранением, чем у L. agilis, и большим разнообразием субстратов, на которых эта бактерия может обитать, и для использования которых нужны соответствующие группы ферментов.

Наконец, полное отсутствие у E. coli белков, чья функция связана с трейхоевыми кислотами, и присутствие этих белков у L. agilis связано со строением клеточной стенки этих бактерий - тейхоевая и липотейхоевая кислоты присутствуют лишь у грамположительных бактерий.

Получение зрелых белков MERS

1 этап. Скачивание полной записи для полипротеина из UniProt

entret 'uniprot:K9N7C7' MERS.tmp

2 этап. Получение списка всех участков из таблицы локальных особенностей с ключом "CHAIN"

grep "FT   CHAIN" MERS.tmp

FT   CHAIN           1..193
FT   CHAIN           194..853
FT   CHAIN           854..2740
FT   CHAIN           2741..3247
FT   CHAIN           3248..3553
FT   CHAIN           3554..3845
FT   CHAIN           3846..3928
FT   CHAIN           3929..4127
FT   CHAIN           4128..4237
FT   CHAIN           4238..4377
FT   CHAIN           4378..5310
FT   CHAIN           5311..5908
FT   CHAIN           5909..6432
FT   CHAIN           6433..6775
FT   CHAIN           6776..7078

3 этап. Сохранение одной выбранной цепи в формате fasta

seqret MERS.tmp -sbegin1 4378 -send1 5310 prot.fasta

4 этап. Редактирование строки заголовка fasta

descseq prot.fasta -name "RNA-directed RNA polymerase" -description "sequence of full protein" prot.fasta

Ссылка для скачивания fasta-файла

Описание утилиты из пакета EMBOSS

descseq

Эта утилита используется для изменения имени или описания поледовательности. при исполнении она читает и записывает последовательность в файл, но с измененным именем или описанием, оставляя при этом саму последовательность неизменной. Опции:

Пример использования:

Старый файл:

>UBB_HUMAN P0CG47 Polyubiquitin-B (Ubiquitin) (Precursor)
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYN
IQKESTLHLVLRLRGG

Ссылка для скачивания fasta-файла

Используем команду:

descseq 5TOG.fasta -name "demonstration" -description "for p9" 5TOG_2.fasta

Новый файл:

>demonstration P0CG47 for p9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYN
IQKESTLHLVLRLRGG

Ссылка для скачивания fasta-файла

Используем команду:

descseq 5TOG_2.fasta -name "(new again)" -append 5TOG_3.fasta

Новый файл:

>demonstration(new again) P0CG47 for p9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYN
IQKESTLHLVLRLRGG

Ссылка для скачивания fasta-файла