Частоты остатков в протеомах
В рамках этого задания были рассмотрены протеомы бактерий Serratia proteamaculans и Escherichia coli (штамма K12). В них нас интересовало количество последовательностей и содержание различных аминокислотных остатков.
В ходе работы были использованы элементы языка bash, программа grep, функции из пакета EMBOSS (wordcount), библиотеки Python (pandas)
Результаты работы приведены в таблицах 1 и 2.
Организм | Идентификатор протеома | Количество последовательностей | Количество аминокислот |
---|---|---|---|
Escherichia coli | UP000000625 | 4391 | 1336643 |
Serratia proteamaculans | UP000007074 | 4930 | 1577723 |
Аминокислота | S. proteamaculans, % | E. coli, % | Разность, % |
---|---|---|---|
L | 11.34 | 10.69 | 0.65 |
A | 10.12 | 9.51 | 0.62 |
G | 7.67 | 7.37 | 0.30 |
V | 7.01 | 7.09 | -0.08 |
S | 5.94 | 5.79 | 0.15 |
R | 5.68 | 5.51 | 0.17 |
I | 5.52 | 6.02 | -0.50 |
E | 5.33 | 5.76 | -0.42 |
T | 5.15 | 5.39 | -0.24 |
Q | 5.06 | 4.44 | 0.62 |
D | 5.05 | 5.14 | -0.09 |
P | 4.61 | 4.44 | 0.18 |
K | 3.91 | 4.41 | -0.50 |
F | 3.79 | 3.90 | -0.11 |
N | 3.62 | 3.93 | -0.32 |
Y | 2.85 | 2.84 | 0.01 |
M | 2.66 | 2.82 | -0.16 |
H | 2.21 | 2.26 | -0.05 |
W | 1.43 | 1.52 | -0.10 |
C | 1.04 | 1.16 | -0.12 |
Как видно из таблицы 2 среди стандартных аминокислот в протеомах обоих бактерий в наибольшем количестве находятся аминокислоты лейцин, аланин, глицин. Это алифатические аминокислоты, у них простые малоэнергозатратные пути синтеза, так что то, что их так много не удивительно. Меньше всего в белках рассматриваемых бактерий цистеина, триптофана и гистидина. В составе радикалов этих аминокислот находятся или азот, или сера – редкие элементы, к тому же пути синтеза этих соединений достаточно сложны (кроме цистеина), поэтому их так мало.
В отношении же различий в содержании аминокислот у двух бактерий следует заметить, что оно не велико, и находится в пределах 0.65%. Больше всего отличается содержание лейцина, у S. proteamaculans его на 0.65% больше. Это различие не велико, особенно с учетом того, что лецина у бактерий больше 10%. Глутамина у бактерий в два раза меньше чем лейицина, при этом у S. Proteamaculans его на 0.62% больше, а лизина, которого и того меньше, содержится наоборот на 0.50% больше у E. coli.
"Тренируйся, панда, и когда-нибудь у тебя станут уши, как у меня!"
Кунг-фу Панда
©Бакулин Артемий, 2018