Протеомы

Название организма Acidothermus cellulolyticus 11B Escherichia coli K12
Идентификатор протеома UP000008221 UP000000625
Количество последовательностей 2157 4352
Количество аминокислот 729829 1353365
Аминокислотный остаток Acidothermus cellulolyticus 11B (%) Escherichia coli K12 (%) Разность (%)
A 13.73 9.51 4.22
L 10.05 10.68 0.63
V 9.19 7.07 2.12
G 8.77 7.37 1.4
R 8.5 5.52 2.98
P 6.18 4.43 1.75
T 5.91 5.39 0.52
D 5.78 5.15 0.63
E 5.13 5.76 0.63
S 5.08 5.8 0.72
I 4.2 6.01 1.81
F 2.93 3.89 0.97
Q 2.76 4.44 1.68
H 2.18 2.27 0.09
Y 2.13 2.84 0.72
N 1.91 3.94 2.03
K 1.71 4.41 2.7
M 1.62 2.83 1.2
W 1.39 1.53 0.14
C 0.85 1.16 0.31

Три наиболее часто встречающиеся аминокислоты почти совпадают в этих протеомах: аланин и лейцин на первых местах в обоих протеомах (только на разных местах), но на третьем месте у Escherichia coli K12 стоит аминокислота глицин, а не валин. Последние две по встречаемости аминокислоты тоже совпадают, а вот третья с конца у Escherichia coli K12 аминокислота гистидин, а не метионин, которая у E. coli на четвертом месте с конца. Для аминокислотного остатка аденина самая большая разница в 4.22% в пользу Acidothermus cellulolyticus 11B, а для глутамина в 2.03% в пользу Escherichia coli K12.

Командная строка для получения файла с табличкой: 'python3 pr7.py AcB11.fasta EcoliK12.fasta', вот сам скрипт на питоне и файлы с протеомами: FASTA файл Acidothermus cellulolyticus 11B и FASTA файл Escherichia coli K12.