Изучение частот остатков в протеомах Escherichia
coli K12 и Deinococcus radiodurans R1
Скачал оба протеома. Посчитал частоту
аминокислотных остатков их с помощью функции wordcount и вывел
результат в Excel. Частоты в обоих протеомах приведены в таблице 1.
Общее количество остатков в протеоме Deinococcus radiodurans R1 (ID = UP000002524)
составляет 949276, у Escherichia coli K12 (ID = UP000000625) - 1356083.
Число последовательностей соответственно 3085 и 4306 (на треть меньше у
Deinococcus).
Таблица 1. Частоты остатков в протеомах Escherichia coli K12 и Deinococcus radiodurans R1 |
Residue | Deinococcus, % | Escherichia, % | Difference, % |
A | 12,2051 | 9,5154 | 2,6897 |
L | 11,6509 | 10,6727 | 0,9782 |
G | 9,1985 | 7,3746 | 1,8239 |
V | 7,6874 | 7,0735 | 0,3022 |
R | 7,3756 | 5,5110 | 1,8646 |
P | 6,0496 | 4,4254 | 1,6242 |
T | 5,8149 | 5,3991 | 0,4158 |
E | 5,7315 | 5,7628 | -0,0313 |
S | 5,1999 | 5,8023 | -0,6024 |
D | 5,0688 | 5,1510 | -0,0822 |
Q | 4,1182 | 4,4401 | -0,3220 |
I | 3,2839 | 6,0103 | -2,7265 |
F | 3,1560 | 3,8905 | -0,7345 |
K | 2,7168 | 4,4061 | -1,6893 |
N | 2,4071 | 3,9454 | -1,5383 |
Y | 2,3028 | 2,8453 | -0,7598 |
H | 2,0855 | 2,2664 | -0,1809 |
M | 1,8915 | 2,8193 | -0,9277 |
W | 1,3882 | 1,5312 | -0,8633 |
C | 0,6679 | 1,1576 | -0,4897 |
U | 0,0000 | 0,0002 | -0,0002 |
Колонка Difference представляет собой разницу
между частотой Deinococcus (взят как базовый) и Escherichia. Видим, что
три самых часто и редко встречаемых остатка почти совпадают. Не
удивительно, что 3 самых частовстречамых аминокислоты - A, L, G, это
характерно для почти любого организма. Однако,
у кишечной палочки 3 раза встречается селеноцистеин (U), которого у
Deinococcus нет вообще. Кроме того, третим по редкости остатком, не считая U, у
палочки является H (гистидин), а у Deinococcus - М (метионин).
Наибольшая разница в процентном содержании характера для А (аланина),
2,69% в пользу Deinococcus, и I (изолейцин), 2,73% в пользу Escherichia.