-
Скачиваю протеом моей Flavobacterium psychrophilum, он является референсным.
В связи с паразитическим образом жизни у бактерии присутствуют белки gliding motility и отсутствует жгутик, в отличие от E. coli, с которой можно ее сравнить.
У F. psychrophilum есть и фрагментированные, и потерянные гены. Среди 377 BUSCO markers of bacteroidetes chlorobi group, 99.5% ортологичных кластеров представлено, это много.
Информацию reviewed/unreviewed можно узнать из соответствующих запросов расширенного поиска по юнипроту (гиперссылки на них приведены).
Посмотрим на повторы аминокислот в белках протеомов. Я написала скрипт, который считает подряд идущие аминокислоты, если их цепочка не меньше пяти: (Colab)
В протеоме E. coli наблюдаются такие повторы:
('L', [5, 5]) ('G', [6, 5]) ('A', [5, 6, 6]) ('V', [7, 5, 5]) ('D', [5]) ('W', [5, 6]) ('T', [5]) ('S', [6, 5, 5]) ('F', [5]) ('P', [6])
У F. psychrophilum:
('Q', [5]) ('E', [5, 6, 8, 5]) ('W', [10]) ('P', [6]) ('I', [5]) ('Y', [6]) ('F', [5]) ('K', [5]) ('A', [5])
Нормируем их количество на размер протеома:
У F. psychrophilum: 71 - общее число аа в учтенных повторах, 806165 - общее число аминокислот в протеоме, индекс - 8.8071300540212e-05
У E. coli, соответственно эти значения: 108, 1354446, 7.973739816869776e-05
То есть по относительному количеству повторов они почти не отличаются.
Для порога в 4 они тоже примерно равны.
Меня интересовало, есть ли общие для них повторы аминокислот: в итоге между десятью повторами АК кишечной палочки и девятью повторами у моей бактерии пересекаются четыре: триптофан, фенилаланин и аланин много повторяется, пролин повторяется по 6 раз у двоих бактерий. Я ожидала частого повторения ароматических аминокислот, но аланин, я думаю, повторяется неспецифично. Много повторов гидрофобных аминокислот: I L D. В целом, протеомы довольно похожи по качеству повторяющихся аминокислот.