Частоты остатков в протеомах
Цель практикума: изучить и сравнить протеомы Escherichia coli (штамма K12) и Ruminiclostridium cellulolyticum H10, а именно содержание различных аминокислотных остатков, используя Bash, Python, EMBOSS. Для подсчета количества последовательностей был использован "grep -c '>' Ecoli.fasta", а для подсчеста аминокислот - "wordcount Ecoli.fasta -wordsize 1 -outfile Ecoli.txt". Результаты работы представлены в таблицах 1 и 2.
Организм | Идентификатор протеома | Количество последовательностей | Количество аминокислот |
---|---|---|---|
Ruminiclostridium cellulolyticum H10 | UP000001349 | 3287 | 1145150 |
Escherichia coli | UP000000625 | 4391 | 1354351 |
Аминокислота | R.cellulolyticum H10,% | E.coli,% | Разность,% |
---|---|---|---|
D | 5.59 | 5.15 | 0.44 |
C | 1.24 | 1.16 | 0.07 |
R | 3.78 | 5.52 | -1.74 |
P | 3.27 | 4.43 | -1.16 |
Q | 2.97 | 4.44 | -1.47 |
T | 5.56 | 5.39 | 0.17 |
Y | 4.07 | 2.85 | 1.22 |
V | 6.76 | 7.07 | -0.31 |
K | 7.83 | 4.41 | 3.42 |
G | 6.87 | 7.36 | -0.49 |
I | 8.62 | 6.01 | 2.61 |
S | 6.77 | 5.80 | 0.97 |
N | 5.67 | 3.94 | 1.73 |
A | 6.40 | 9.51 | -3.10 |
E | 6.64 | 5.76 | 0.88 |
W | 0.90 | 1.53 | -0.63 |
M | 2.59 | 2.83 | -0.23 |
L | 8.78 | 10.68 | -1.90 |
F | 4.23 | 3.89 | 0.34 |
H | 1.45 | 2.27 | -0.82 |
Как видно из таблицы 2 среди стандартных аминокислот в протеоме R.cellulolyticum H10 наиболее распространенны такие аминокислоты, как изолейцин, лизин, лейцин (IKL), а среди E.coli- аланин, лейцин, глицин (ALG). Эти аминокислоты являются алифатическими, то есть играют важную роль у организмов, так как обладают неполярными боковыми цепям. Лейцина в E.coli на 1.90% больше, чем в протеоме R.cellulolyticum. Самая большая разница в двух протеомах пренадлежит аланину, причем в пользу E.coli (3.10%). Меньше всего в белках рассматриваемых бактерий триптофана, цистеина, гистидина (WCH), хотя цистеин представлен в почти одинаковом количестве у этих организмов: 1.24 у R.cellulolyticum H10, 1.16-E.coli. Таблица 2 была получена с помощью программы PYTHON
Загрузить скрипт