Сравнение протеомов

Выбор протеомов

Моей бактерий ей была Psychrobacter alimentarius. Ее протеом есть в базе Proteomes, причем он не является избыточным или удаленным. Пан-протеом Psychrobacter arcticus является референсным. Сравним эти два протеома, чтобы выбрать более подходящий (P. alimentarius /// P. arcticus)
Идентификатор протеома в Proteomes: UP000076104 /// UP000000546
Количество белков: 2673 /// 2099
Swiss-prot: 0 /// 333
CPD: Standard /// Close to standard (low value)
BUSCO: C:99% (S:98.6% D:0.4%) F:0.1% M:0.9% /// C:98.5% (S:98.5% D:0%) F:0.3% M:1.3%

Я думаю, что нет смысла использовать референсный протеом. Протеом штамма моей бактерии состоит из большего количества белков, при этом он не является избыточным и имеет CPD "Standard", в то время как референсный "Close to standard (low value)", поэтому для более полного описания я буду использовать именно протеом Psychrobacter alimentarius - UP000076104.

В качестве сравнения я попробовала найти патогенную бактерию, максимально таксономически приближенную к моей. В роде Psychrobacter нет патоегнных бактерий, а в семействе Moraxellaceae есть несколько патогенных видов. Я нашла довольно распространенную патогенную бактерию Acinetobacter baumannii, нашла ее протеом в Proteomes. Ее протеом является частью пан-протеома Acinetobacter calcoaceticus (strain PHEA-2), поэтому именно протеом Acinetobacter calcoaceticus (strain PHEA-2) я выбрала в качестве контроля.

Краткое описание протеомов и сравнение степени их изученности


Идентификатор протеома в Proteomes: UP000076104
Количество белков: 2673
Swiss-prot: 0
CPD: Standard
BUSCO:
C:99% (S:98.6% D:0.4%) F:0.1% M:0.9%

Идентификатор протеома в Proteomes: UP000076104
Количество белков: 3598
Swiss-prot: 6
CPD: Close to standard (low value)
BUSCO:
C:97.6% (S:97.6% D:0%) F:1.4% M:1%

В обоих протеомах ничтожно малое количество белков занесено в базу Swiss-Prot. Это, конечно, вызывает некоторые опасения, но в разделе Publications для каждого протеома можно найти только одну статью ("Genome sequencing of... ") - видимо, изучение полных протеомов этих бактерий не очень активно происходит в наши дни. Несмотря на это показатели CPD и BUSCO довольно надежные: стандартный и близкий к стандартному, а что касается BUSCO, то "пропавших" и "фрагментированных" белков очень мало, поэтому с этими протеомами можно работать. Подведя итоге, можно сказать, что протеомы изучены средненько: белки синтезированы, но особо не исследованы ни эксперементаторами, ни Swiss-Prot (что в принципе закономерно).

Скачивание протеомов

Psychrobacter alimentarius PAMC 27889:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000076104) ' -O ~/term2/pr8/UP000076104.swiss.gz

Acinetobacter calcoaceticus (strain PHEA-2):
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000007477) ' -O ~/term2/pr8/UP000007477.swiss.gz

Сравнение протеомов по группам белков

Доли функциональных групп белков в протеомах
Функциональная группа белков UP000076104 (моя) UP000007477 (контроль)
Трансмембранные белки 602 (22,52%) 776 (21,57%)
Ферменты 23 (0,86%) 24 (0,67%)
heat shock protein 16 (0,60%) 18 (0,50%)
Адгезины 0 4



zgrep '^KW' UP000007477.swiss.gz | grep 'Transmembrane {' | wc -l | less
zgrep '^KW' UP000007477.swiss.gz | grep 'enzyme {' | wc -l | less

(#пояснение: проверяла результаты в Bash с расширенным поиском по UniProtKB и заметила, что для этих KW существует несколько вариантов (например, для Transmembrane существуют два более специализированных варианта: "Transmembrane helix" и "Transmembrane beta strand"), при этом в формате Text идет 2 строки: сначала просто "Transmembrane {ECO:###}", а затем специализированная строка "Transmembrane helix {ECO:###}". Поэтому чтобы не считать один и тот же белок дважды, ищу в целом только строку 'Transmembrane {'. )

heat shock proteins

Моя бактерия известна тем, что обитает в холодных средах (холодная вода и породы Антарктиды), то есть она психрофильна (и психротрофна), а вот контрольный организм встречается в стоках, почве, а также является патогенной (поражает слизистые и кожу людей). Я хотела найти белки, которые встречаются у психрофиллов чаще, чем у остальных организмов. Это вызвало небольшие трудности, так как оказалось, что как такого класса белков нигде не описано, а упоминания, которые я нашла, не встречаются у моей бактерии (наример AFP - antifreeze proteins). Кроме белков именно низких температур довольно часто упоминались heat shock proteins - это класс функционально сходных белков, экспрессия которых повышается при стрессовых условиях, особенно при повышении температуры. Я подумлаа, что для психрофиллов эти белки будут довольно важными, так как при попадании в среду с повышенной температурой им необходимо особенно регулировать синтез белков (а белки теплового шока регулируют корректную сборку третичной и четвертичной структуры белков).

Получилось, что у Acinetobacter calcoaceticus таких белков больше (на 2, но их все же больше), хотя в процентном соотношении их больше у Psychrobacter alimentarius. Вообще, я думала, что у моей бактерии их будет отличимо больше, но подобный результат тоже модно объяснить: белки теплового шока также называются белками стресса, а контрольная бактерия очень устойчива к терапии. Поэтому эти белки необходимы Psychrobacter alimentarius для нормальног функционирования при изменении температур, а Acinetobacter calcoaceticus - для повышения устойчивости к медикаментозным препаратам.

Адгезины

Адгезины - белки патогенных бактерий, которые необходимы для эффективной адгезии и прикрепления к поверхности слизистой. Выбранная патогенная бактерия как раз встречается на слизистых, поэтому в ее протеоме есть адгезины, а вот моей бактерии они не нужны.

Сравнение протеомов по...

по содержанию Gly (G)

В статье "Порообразующие белки наружной мембраны некоторых грамотрицательных бактерий" (УДК 577.012.5’083.3) я прочитала, что содержание глицина у патогенных бактерий в мембране, чем у непатогенных (находится в наружной мембране, в области тримера порина либо индивидуальными АК, либо в составе глициновых клестеров β-тяжей). Проверим содержание глицина в мембранных белках. Напишу на питоне.

Ссылка на код тут

Psychrobacter alimentarius - 7,102%

Acinetobacter calcoaceticus - 7,211%

Я искала по словам 'membrane', 'transmembrane' и 'intramembrane', чтобы максимально покрыть все возможные мембранные белки. Искала глицин в последовательности белков и нашла его процентное содержание. Оказалось, что в мембране непатогенной бактерии глицина чуть больше, чем в патогенной. Я думаю это потому, что важно смотреть именно в области порина, но как это осуществить я не совсем понимаю, но в целом посмотреть содержание глицина получилось.