Исследование протеомов:

· Flavobacterium psychrophilum · Escherichia coli ·

-

Скачиваю протеом моей Flavobacterium psychrophilum, он является референсным.
В связи с паразитическим образом жизни у бактерии присутствуют белки gliding motility и отсутствует жгутик, в отличие от E. coli, с которой можно ее сравнить.

Протеом Flavobacterium psychrophilum strain ATCC 49511 / DSM 21280 / CIP 103535 / JIP02/86:
  • Идентификатор: UP000006394
  • Число генов=белков: 2421, (Swiss-Prot 221)
  • CPD: Standard
  • BUSCO: C:99.5% (S:99.3% D:0.1%) F:0.1% M:0.4%
Протеом Escherichia coli strain K12 / MG1655 / ATCC 47076
  • Идентификатор: UP000000625
  • Число генов=белков: 4403 (Swiss-Prot 4401)
  • CPD: Standard
  • BUSCO: C:100% (S:99.3% D:0.7%) F:0% M:0%

У F. psychrophilum есть и фрагментированные, и потерянные гены. Среди 377 BUSCO markers of bacteroidetes chlorobi group, 99.5% ортологичных кластеров представлено, это много.

  1. Трансмембранные белки:
    у F. psychrophilum 18.75% (17 reviewed + 437 unreviewed) (первое число в скобках всегда относится к reviewed, второе, соответственно, нет); у E. coli 22.5% (993)
    В первом случае неаннотированные белки попадают в эту категорию автоматически из-за высокого индекса гидрофобности.
    Команда: zgrep '^KW' | grep 'Transmembrane' | wc -l
  2. Ферменты:
    у F. psychrophilum 1.2% (15+14); у E. coli 5.1% (223 reviewed)
    Команда: zgrep '^DE' filename | grep 'EC=' | wc -l
  3. Белки, связанные с движением:
    Gliding motility у F. psychrophilum 0.7% (18 unreviewed) и один unreviewed белок, ассоциированный со жгутиком - A6GVQ8 · A6GVQ8_FLAPJ, Flagellar motor/Chemotaxis (MotB)-related lipoprotein; у E. coli их 93 reviewed (2.1%) ассициированных со жгутиком белка.
    Команды: zgrep '^KW' | grep 'Gliding motility' | wc -l;
    zgrep '^KW' | grep 'Flagellum' | wc -l

Информацию reviewed/unreviewed можно узнать из соответствующих запросов расширенного поиска по юнипроту (гиперссылки на них приведены).

Сравнение протеомов

Посмотрим на повторы аминокислот в белках протеомов. Я написала скрипт, который считает подряд идущие аминокислоты, если их цепочка не меньше пяти: (Colab)

В протеоме E. coli наблюдаются такие повторы:
('L', [5, 5]) ('G', [6, 5]) ('A', [5, 6, 6]) ('V', [7, 5, 5]) ('D', [5]) ('W', [5, 6]) ('T', [5]) ('S', [6, 5, 5]) ('F', [5]) ('P', [6])

У F. psychrophilum:
('Q', [5]) ('E', [5, 6, 8, 5]) ('W', [10]) ('P', [6]) ('I', [5]) ('Y', [6]) ('F', [5]) ('K', [5]) ('A', [5])

Нормируем их количество на размер протеома:
У F. psychrophilum: 71 - общее число аа в учтенных повторах, 806165 - общее число аминокислот в протеоме, индекс - 8.8071300540212e-05
У E. coli, соответственно эти значения: 108, 1354446, 7.973739816869776e-05
То есть по относительному количеству повторов они почти не отличаются.
Для порога в 4 они тоже примерно равны.

Меня интересовало, есть ли общие для них повторы аминокислот: в итоге между десятью повторами АК кишечной палочки и девятью повторами у моей бактерии пересекаются четыре: триптофан, фенилаланин и аланин много повторяется, пролин повторяется по 6 раз у двоих бактерий. Я ожидала частого повторения ароматических аминокислот, но аланин, я думаю, повторяется неспецифично. Много повторов гидрофобных аминокислот: I L D. В целом, протеомы довольно похожи по качеству повторяющихся аминокислот.