Частоты остатков в протеомах

В рамках этого задания были рассмотрены протеомы бактерий Serratia proteamaculans и Escherichia coli (штамма K12). В них нас интересовало количество последовательностей и содержание различных аминокислотных остатков.
В ходе работы были использованы элементы языка bash, программа grep, функции из пакета EMBOSS (wordcount), библиотеки Python (pandas)
Результаты работы приведены в таблицах 1 и 2.

Таблица 1. Описание протеомов S. proteamaculans и E. coli.
Организм Идентификатор протеома Количество последовательностей Количество аминокислот
Escherichia coli UP000000625 4391 1336643
Serratia proteamaculans UP000007074 4930 1577723
Таблица 2. Статистика содержания аминокислот.
Аминокислота S. proteamaculans, % E. coli, % Разность, %
L 11.34 10.69 0.65
A 10.12 9.51 0.62
G 7.67 7.37 0.30
V 7.01 7.09 -0.08
S 5.94 5.79 0.15
R 5.68 5.51 0.17
I 5.52 6.02 -0.50
E 5.33 5.76 -0.42
T 5.15 5.39 -0.24
Q 5.06 4.44 0.62
D 5.05 5.14 -0.09
P 4.61 4.44 0.18
K 3.91 4.41 -0.50
F 3.79 3.90 -0.11
N 3.62 3.93 -0.32
Y 2.85 2.84 0.01
M 2.66 2.82 -0.16
H 2.21 2.26 -0.05
W 1.43 1.52 -0.10
C 1.04 1.16 -0.12

Как видно из таблицы 2 среди стандартных аминокислот в протеомах обоих бактерий в наибольшем количестве находятся аминокислоты лейцин, аланин, глицин. Это алифатические аминокислоты, у них простые малоэнергозатратные пути синтеза, так что то, что их так много не удивительно. Меньше всего в белках рассматриваемых бактерий цистеина, триптофана и гистидина. В составе радикалов этих аминокислот находятся или азот, или сера – редкие элементы, к тому же пути синтеза этих соединений достаточно сложны (кроме цистеина), поэтому их так мало.
В отношении же различий в содержании аминокислот у двух бактерий следует заметить, что оно не велико, и находится в пределах 0.65%. Больше всего отличается содержание лейцина, у S. proteamaculans его на 0.65% больше. Это различие не велико, особенно с учетом того, что лецина у бактерий больше 10%. Глутамина у бактерий в два раза меньше чем лейицина, при этом у S. Proteamaculans его на 0.62% больше, а лизина, которого и того меньше, содержится наоборот на 0.50% больше у E. coli.

Загрузить скрипт

"Тренируйся, панда, и когда-нибудь у тебя станут уши, как у меня!"
Кунг-фу Панда

Назад

©Бакулин Артемий, 2018