В ходе практикума были освоены команды, входящие в пакет EMBOSS: grep, wordcount.
Для изучения были взяты протеомы Escherichia coli (штамм K12) и
Xylella fastidiosa (штамм 9a5c).
Таблица 2, показывающая процентное содержание аминокислотных остатков в протеомах бактерий, была создана с помощью
Python.
Таблица 1.
Xylella fastidiosa (штамм 9a5c)
Escherichia coli (штамм K12)
Идентификатор протеома
UP000000812
UP000000625
Количество последовательностей
2772
4352
Количество аминокислот
743229
1353357
Данные для таблицы 1 были получены с помощью команд grep -c (подсчет количества последовательностей) и wc (подсчет количества аминокислот).
Таблица 2.
Остаток
Содержание в X. fastidiosa 9a5c
Содержание в E. coli K12
Разность
L
10.714%
10.676%
0.04%
A
10.235%
9.507%
0.73%
G
7.586%
7.366%
0.22%
V
7.336%
7.07%
0.27%
R
6.694%
5.52%
1.17%
S
5.98%
5.799%
0.18%
T
5.796%
5.395%
0.4%
I
5.336%
6.011%
-0.67%
D
5.3%
5.147%
0.15%
E
5.071%
5.762%
-0.69%
P
4.926%
4.429%
0.5%
Q
4.215%
4.443%
-0.23%
K
3.562%
4.407%
-0.85%
F
3.471%
3.894%
-0.42%
N
3.358%
3.938%
-0.58%
H
2.743%
2.269%
0.47%
Y
2.618%
2.845%
-0.23%
M
2.403%
2.825%
-0.42%
W
1.464%
1.532%
-0.07%
C
1.19%
1.162%
0.03%
Вывод из таблицы 2:
Как можно ясно видеть из таблицы, три самых распространенных аминокислотных остатка в обоих протеомах - L (Лейцин), A (Аланин), G (Глицин).
Два самых редких остатка (W - триптофан, C - цистеин) одинаковы у E. coli K12 и X. fastidiosa 9a5c, а третие различаются:
M (Метионин) и H (Гистидин).
Наибольшая разница в процентном содержании в пользу X. fastidiosa наблюдается для R (аргинин), а в пользу E. coli для K (лизин).
Таким образом, несмотря на некоторые различия, в протеоме разных бактерий сохраняется похожее соотношение аминокислотных остатков.