Практикум 7

EMBOSS и протеомы

В ходе практикума были освоены команды, входящие в пакет EMBOSS: grep, wordcount. Для изучения были взяты протеомы Escherichia coli (штамм K12) и Xylella fastidiosa (штамм 9a5c).
Таблица 2, показывающая процентное содержание аминокислотных остатков в протеомах бактерий, была создана с помощью Python.
Таблица 1.
Xylella fastidiosa (штамм 9a5c)Escherichia coli (штамм K12)
Идентификатор протеомаUP000000812UP000000625
Количество последовательностей27724352
Количество аминокислот743229 1353357
Данные для таблицы 1 были получены с помощью команд grep -c (подсчет количества последовательностей) и wc (подсчет количества аминокислот).
Таблица 2.
ОстатокСодержание в X. fastidiosa 9a5cСодержание в E. coli K12Разность
L 10.714% 10.676% 0.04%
A 10.235% 9.507% 0.73%
G 7.586% 7.366% 0.22%
V 7.336% 7.07% 0.27%
R 6.694% 5.52% 1.17%
S 5.98% 5.799% 0.18%
T 5.796% 5.395% 0.4%
I 5.336% 6.011% -0.67%
D 5.3% 5.147% 0.15%
E 5.071% 5.762% -0.69%
P 4.926% 4.429% 0.5%
Q 4.215% 4.443% -0.23%
K 3.562% 4.407% -0.85%
F 3.471% 3.894% -0.42%
N 3.358% 3.938% -0.58%
H 2.743% 2.269% 0.47%
Y 2.618% 2.845% -0.23%
M 2.403% 2.825% -0.42%
W 1.464% 1.532% -0.07%
C 1.19% 1.162% 0.03%

Вывод из таблицы 2:

Как можно ясно видеть из таблицы, три самых распространенных аминокислотных остатка в обоих протеомах - L (Лейцин), A (Аланин), G (Глицин). Два самых редких остатка (W - триптофан, C - цистеин) одинаковы у E. coli K12 и X. fastidiosa 9a5c, а третие различаются: M (Метионин) и H (Гистидин).
Наибольшая разница в процентном содержании в пользу X. fastidiosa наблюдается для R (аргинин), а в пользу E. coli для K (лизин).
Таким образом, несмотря на некоторые различия, в протеоме разных бактерий сохраняется похожее соотношение аминокислотных остатков.