Частоты остатков в протеомах Escherichia coli (strain K12) и Atopobium parvulum DSM 20469

Таблица 1. Информация о протеомах сравниваемых организмов
Организм Atopobium parvulum DSM 20469 Escherichia coli (strain K12)
Идентификатор протеома UP000000960 UP000000625
Число последовательностей 1353 4306
Суммарное число аминокислотных остатков 459227 1356086

Комментарий к таблице 1. В работе проводится сравнение частот аминокислотных остатков у бактерий Atopobium parvulum и Escherichia coli. У последней хорошо изучен геном, поэтому процентное соотношение различных аминокислотных остатков в её белках в целом характерно для бактерий. Результаты сравнения приведены в таблице 2.

Таблица 2. Результаты сравнения протеомов
Аминокислотный остаток Процентное содержание в A. parvulum Процентное содержание в E. coli Разность процентов
A 9,54 9,52 0,02
L 9,40 10,67 -1,27
V 7,79 7,07 0,72
G 7,26 7,37 -0,11
S 6,72 5,80 0,92
E 6,55 5,76 0,79
I 6,18 6,01 0,17
T 5,95 5,40 0,55
D 5,90 5,15 0,75
K 5,10 4,41 0,69
R 4,72 5,51 -0,79
F 3,96 3,89 0,07
P 3,92 4,43 -0,51
N 3,84 3,95 -0,11
Q 3,56 4,44 -0,88
Y 2,95 2,85 0,10
M 2,44 2,82 -0,38
H 1,97 2,27 -0,30
C 1,28 1,16 0,12
W 0,98 1,53 -0,55
U 0,00021776 0,00022123 -3,47 * 10^(-6)

Комментарий к таблице 2. Из результатов видно, что в четыре самых частых аминокислотных остатка входят одинаковые остатки у обоих организмов (A - аланин, L - лизин, V - валин и G - глицин). Аналогично для трёх, четырёх, пяти и даже шести самых редких остатков (Y - тирозин, M - метионин, H - гистидин, C - цистеин, W - триптофан, U - селеноцистеин). А самая большая процентная разность по абсолютной величине у остатка лейцина.

Разница между программами wordcount и compseq в Bash

Wordcount...
Compseq
.