Сравнение протеомов Lactobacillus agilis и Escherichia coli
Характеристика | Lactobacillus agilis | Escherichia coli |
---|---|---|
ID протеома | UP000051008 | UP000000625 |
Количество белков | 1,951 | 4,391 |
Количество белков в Swiss-Prot | 0 | 4389 |
Запрос | annotation:(type:transmem) AND proteome:up000051008 | annotation:(type:transmem) AND proteome:up000000625 |
Количество белков (в Swiss-Prot) | 403(0) | 946(946) |
Запрос | ec:* AND proteome:up000051008 | ec:* AND proteome:up000000625 |
Количество белков(в Swiss-Prot) | 397(0) | 1676(1676) |
Запрос | annotation:(type:function *teichoic*) AND proteome:up000000625 | annotation:(type:function *teichoic*) AND proteome:up000051008 |
Количество белков(в Swiss-Prot) | 3(0) | 0(0) |
Для начала стоит отметить, что из-за большой разницы (в несколько раз) в числе белков сравниваемых бактерий использовать в анализе абсолютные значения количеств нерационально, а значит имеет смысл составить Таблицу 2:
Признак группы | Lactobacillus agilis | Escherichia coli |
---|---|---|
Трансмембранные | 20,66% | 21,55% |
Ферменты | 20,35% | 38,17% |
Функция связана с трейхоевыми кислотами | 0,15% | 0 |
Теперь можно проанализировать полученные данные.
При просмотре таблицы 2 можно заметить, что доля трансмембранных белков в протеомах обеих бактерий примерна одинакова (отличие всего на 0,89%), что удивительно, учитывая, что L. agilis является грамположительной бактерией, а E. coli - грамотрицательной, из-за чего можно было ожидать большего превосходства по числу белков у E. coli.
Объясниь это можно так: в данном случае разнообразие белков E. coli может не распространяться на трансмембранные, а значит и использование при анализе данных относительных значений было ошибочным. При сравнении абсолютных значений разница налицо - в 2,4 раза.
Альтернативным объяснением несовпадения теоретических умозаключений и практически полученных данных может быть то, что более развитая поверхность мембран E. coli (а у грамотрицательных бактерий их две) вовсе не подразумевает соответственное увеличение числа трансмембранных белков, а сама эта зависимость сомнительна и требует дальнейшего сопоставления числа трансмембранных белков у грамположительных и грамотрицательных бактерий.
Наконец, еще одним объяснением может быть банальная нехватка данных о протеоме L. agilis: для этой бактериии нет рецензированных белков, даже несмотря на то, что фигурирующий в исследовании протеом вляется референсным; а значит под сомнение можно поставить полученные даннные: возможно, среди белков есть, например, повторяющиеся.
По моему мнению наиболее вероятно первое объяснение: количество функций трансмембраных белков, а значит и их разнообразие, не может быть прямо пропорционально размеру протеома организма, так как двум разным мембранам (как у грамотрицательной E. coli) соответствуют разные их свойства, а значит и большее разнообразие находящихся в них белков, чем у гипотетической грамположительной бактерии с тем же числом белков, но относительное число трансмембранных белков может быть такое же, как у грамположительной бактерии с меньшим протеомом за счет большего разнообразия других протеинов.
А вот преобладание доли ферментов ото всех белков в E. coli может быть объяснено ее более широким распрстранением, чем у L. agilis, и большим разнообразием субстратов, на которых эта бактерия может обитать, и для использования которых нужны соответствующие группы ферментов.
Наконец, полное отсутствие у E. coli белков, чья функция связана с трейхоевыми кислотами, и присутствие этих белков у L. agilis связано со строением клеточной стенки этих бактерий - тейхоевая и липотейхоевая кислоты присутствуют лишь у грамположительных бактерий.
Получение зрелых белков MERS
1 этап. Скачивание полной записи для полипротеина из UniProt
entret 'uniprot:K9N7C7' MERS.tmp
2 этап. Получение списка всех участков из таблицы локальных особенностей с ключом "CHAIN"
grep "FT CHAIN" MERS.tmp
FT CHAIN 1..193 FT CHAIN 194..853 FT CHAIN 854..2740 FT CHAIN 2741..3247 FT CHAIN 3248..3553 FT CHAIN 3554..3845 FT CHAIN 3846..3928 FT CHAIN 3929..4127 FT CHAIN 4128..4237 FT CHAIN 4238..4377 FT CHAIN 4378..5310 FT CHAIN 5311..5908 FT CHAIN 5909..6432 FT CHAIN 6433..6775 FT CHAIN 6776..7078
3 этап. Сохранение одной выбранной цепи в формате fasta
seqret MERS.tmp -sbegin1 4378 -send1 5310 prot.fasta
4 этап. Редактирование строки заголовка fasta
descseq prot.fasta -name "RNA-directed RNA polymerase" -description "sequence of full protein" prot.fasta
Ссылка для скачивания fasta-файла
Описание утилиты из пакета EMBOSS
descseq
Эта утилита используется для изменения имени или описания поледовательности. при исполнении она читает и записывает последовательность в файл, но с измененным именем или описанием, оставляя при этом саму последовательность неизменной. Опции:
Пример использования:
Старый файл:
>UBB_HUMAN P0CG47 Polyubiquitin-B (Ubiquitin) (Precursor) MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYN IQKESTLHLVLRLRGG
Ссылка для скачивания fasta-файла
Используем команду:
descseq 5TOG.fasta -name "demonstration" -description "for p9" 5TOG_2.fasta
Новый файл:
>demonstration P0CG47 for p9 MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYN IQKESTLHLVLRLRGG
Ссылка для скачивания fasta-файла
Используем команду:
descseq 5TOG_2.fasta -name "(new again)" -append 5TOG_3.fasta
Новый файл:
>demonstration(new again) P0CG47 for p9 MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYN IQKESTLHLVLRLRGG