Частоты остатков в протеомах

Цель практикума: изучить и сравнить протеомы Escherichia coli (штамма K12) и Ruminiclostridium cellulolyticum H10, а именно содержание различных аминокислотных остатков, используя Bash, Python, EMBOSS. Для подсчета количества последовательностей был использован "grep -c '>' Ecoli.fasta", а для подсчеста аминокислот - "wordcount Ecoli.fasta -wordsize 1 -outfile Ecoli.txt". Результаты работы представлены в таблицах 1 и 2.

Таблица 1. Описание протеомов E. coli и Ruminiclostridium cellulolyticum H10.
Организм Идентификатор протеома Количество последовательностей Количество аминокислот
Ruminiclostridium cellulolyticum H10 UP000001349 3287 1145150
Escherichia coli UP000000625 4391 1354351
Таблица 2. Статистика содержания аминокислот
Аминокислота R.cellulolyticum H10,% E.coli,% Разность,%
D 5.59 5.15 0.44
C 1.24 1.16 0.07
R 3.78 5.52 -1.74
P 3.27 4.43 -1.16
Q 2.97 4.44 -1.47
T 5.56 5.39 0.17
Y 4.07 2.85 1.22
V 6.76 7.07 -0.31
K 7.83 4.41 3.42
G 6.87 7.36 -0.49
I 8.62 6.01 2.61
S 6.77 5.80 0.97
N 5.67 3.94 1.73
A 6.40 9.51 -3.10
E 6.64 5.76 0.88
W 0.90 1.53 -0.63
M 2.59 2.83 -0.23
L 8.78 10.68 -1.90
F 4.23 3.89 0.34
H 1.45 2.27 -0.82

Как видно из таблицы 2 среди стандартных аминокислот в протеоме R.cellulolyticum H10 наиболее распространенны такие аминокислоты, как изолейцин, лизин, лейцин (IKL), а среди E.coli- аланин, лейцин, глицин (ALG). Эти аминокислоты являются алифатическими, то есть играют важную роль у организмов, так как обладают неполярными боковыми цепям. Лейцина в E.coli на 1.90% больше, чем в протеоме R.cellulolyticum. Самая большая разница в двух протеомах пренадлежит аланину, причем в пользу E.coli (3.10%). Меньше всего в белках рассматриваемых бактерий триптофана, цистеина, гистидина (WCH), хотя цистеин представлен в почти одинаковом количестве у этих организмов: 1.24 у R.cellulolyticum H10, 1.16-E.coli. Таблица 2 была получена с помощью программы PYTHON

Загрузить скрипт