Протеом E. coli K 12: ID UP000000625, 4313 последовательностей, 1351630 ао
Протеом H. marismortui ATCC 43049: ID UP000001169, 4234 последовательностей, 1200597 ао
Таблица сравнения протеомов
Aminoacid | Part in E. coli proteome, % | Part in H. marismortui proteome, % | Difference |
A | 9.51148 | 10.41482 | -0.90334 |
C | 1.16089 | 0.75712 | 0.40377 |
D | 5.14912 | 8.32636 | -3.17724 |
E | 5.76593 | 8.08964 | -2.32372 |
F | 3.89263 | 3.25413 | 0.63850 |
G | 7.37043 | 8.27805 | -0.90761 |
H | 2.26771 | 2.00525 | 0.26245 |
I | 6.00978 | 4.38648 | 1.62330 |
K | 4.40572 | 2.00117 | 2.40455 |
L | 10.67570 | 8.81037 | 1.86534 |
M | 2.82252 | 1.87782 | 0.94470 |
N | 3.93688 | 2.58630 | 1.35058 |
O | 0.00000 | 0.00000 | 0.00000 |
P | 4.42828 | 4.59055 | -0.16227 |
Q | 4.44338 | 3.12395 | 1.31943 |
R | 5.51860 | 6.11421 | -0.59561 |
S | 5.79663 | 5.95487 | -0.15824 |
T | 5.39401 | 6.91556 | -1.52155 |
U | 0.00022 | 0.00000 | 0.00022 |
V | 7.07302 | 8.64845 | -1.57543 |
W | 1.53185 | 1.14710 | 0.38476 |
Y | 2.84464 | 2.71781 | 0.12682 |
Комментарии к таблице:
-
Самыми частыми аминокислотными остатками в составе протеома
археи H. marismortui являются аланин (A), лейцин (L) и валин(V)
(в порядке убывания частоты), у бактерии E. coli самыми распостранёнными
остатками являются лейцин (L), аланин (A) и глицин (G).
Таким образом, в протеомах обоих организмов наиболее распостранены
гидрофобные аминокислоты аланин и лейцин.
-
Самыми редкими аминокислотами у археи являются метионин (M),
триптофан (W), цистеин (C) (в порядки убывания частоты),
для кишечной палочки наиболее редки гистидин (H), триптофан(W) и
цистеин (C).
Таким образом, в протеомах обоих организмов наименее распостранены
аминокислоты триптофан и цистеин.
-
Наиболее значимо различаются протеомы по содержанию лизина (K) и аспартата (D):
лизина на 2,41% больше в протеоме E. coli, аспартата на 3,18% больше
в протеоме H. marismortui, - соответственно, это самые большие отклонения в
пользу одного и другого организмов.
-
В записях протеомов в явном виде не представлено пирролизина (O), с помощью команды
compseq было показано его отсутствие в протеоме H. marismortui, в протеоме
E. coli compseq обнаруживает 8 аминокислот, отмеченных как X, поскольку
пирролизин присущ метаногенным археям, скорее всего он не входит в эти 8 остаков.
Селеноцистеин (U) есть только у E. coli, всего лишь 3 ао.
Материалы и методы:
- Протеомы были скачаны из банка UniProt Proteomes
- ID протеомов, а также чило последовательностей в них были взяты из их
записей в UniProt Proteomes (последнее также было проверено с помощью bash-команды
grep -E -c "^>" [input_proteome]), общее число аминокислотных остатков в протеомах
было посчитано с помощью bash-конвейера sed -r '/^>/d' [input_proteome] | sed '1i\>seq'
| infoseq -only -length -filter, а затем проверено программой compseq.
- Количества различных аминокислот в протеомах было посчитано программой wordcount
(команда wordcount [input_proteome] -wordsize 1 stdout), с её же помощью
выявлены наиболее редкие и частые аминокислоты протеомов.
- Таблица создана с помощью python-скрипта, вызов
python ~stepan_puhov/term2/linux/pr6/table.py ~stepan_puhov/term2/linux/pr6/ecoli.aa 'E. coli' ~stepan_puhov/term2/linux/pr6/archaea.aa 'H. marismortui'
|