Практикум 7: протеомы и EMBOSS

Были рассмотрены протеомы:
1. Протеом Corynebacterium pseudotuberculosis 31 - состоит из 2173 белковых последовательностей, суммарно - 693838 остатков.
2. Протеом Escherichia coli (штамма K12) - состоит из 4306 белковых последовательностей, которые содержат 15282258 аминокислотных остатков.

Частота встречаемости букв в указанных протеомах:
Код а.к.о. C.pseudotuberculosis 31 E.coli (штамма K12) Разность
A 10.94% 8.60% 2.34%
L 9.65% 9.84% -0.19%
V 8.08% 6.52% 1.56%
G 8.03% 6.90% 1.13%
S 6.50% 6.75% -0.25%
E 6.07% 5.56% 0.51%
T 5.96% 5.73% 0.23%
R 5.78% 5.58% 0.20%
I 5.76% 6.29% -0.53%
D 5.63% 5.23% 0.39%
P 4.83% 4.18% 0.65%
K 3.92% 5.09% -1.16%
F 3.46% 4.12% -0.66%
Q 3.37% 4.17% -0.81%
N 3.12% 4.60% -1.49%
Y 2.25% 3.18% -0.92%
M 2.25% 2.63% -0.39%
H 2.24% 2.23% 0.02%
W 1.36% 1.47% -0.11%
C 0.80% 1.32% -0.52%
U - 0.00% 0.00%
Z - 0.00% 0.00%


Проанализируем полученные данные:

0. Стоит отметить, что количественное содержание остатков в обоих протеомах практически совпадает.

1. В протеоме С. pseudotuberculosis наиболее часто встречаемый а.к.о. – аланин (А), в то время как в протеоме E.coli – это лейцин (L). Также у С. pseudotuberculosis тройку самых частых остатков завершает валин (V), а у E.coli это место занимает глицин (G). Однако заметим, что в обоих случаях первые три самые частые а.к.о. относятся к группе неполярных.

2. Тройки самых редких а.к.о. в протеомах совпадают, причем со сравнительно небольшим процентным разрывом.

3. Самая большая разница в пользу моей бактерии – у аланина, целых 2.34%.

4. Самая большая разница в пользу бактерии E. coli – у аспарагина, отрыв составил 1.49%.


© Svetlana Kozyulina, 2017