Сравнение аминокислотного состава протеомов E. coli (штамм K12) и Haloarcula marismortui (штамм ATCC 43049)

Протеом E. coli K 12: ID UP000000625, 4313 последовательностей, 1351630 ао

Протеом H. marismortui ATCC 43049: ID UP000001169, 4234 последовательностей, 1200597 ао


Таблица сравнения протеомов

AminoacidPart in E. coli proteome, %Part in H. marismortui proteome, %Difference
A9.5114810.41482-0.90334
C1.160890.757120.40377
D5.149128.32636-3.17724
E5.765938.08964-2.32372
F3.892633.254130.63850
G7.370438.27805-0.90761
H2.267712.005250.26245
I6.009784.386481.62330
K4.405722.001172.40455
L10.675708.810371.86534
M2.822521.877820.94470
N3.936882.586301.35058
O0.000000.000000.00000
P4.428284.59055-0.16227
Q4.443383.123951.31943
R5.518606.11421-0.59561
S5.796635.95487-0.15824
T5.394016.91556-1.52155
U0.000220.000000.00022
V7.073028.64845-1.57543
W1.531851.147100.38476
Y2.844642.717810.12682

Комментарии к таблице:

  • Самыми частыми аминокислотными остатками в составе протеома археи H. marismortui являются аланин (A), лейцин (L) и валин(V) (в порядке убывания частоты), у бактерии E. coli самыми распостранёнными остатками являются лейцин (L), аланин (A) и глицин (G). Таким образом, в протеомах обоих организмов наиболее распостранены гидрофобные аминокислоты аланин и лейцин.
  • Самыми редкими аминокислотами у археи являются метионин (M), триптофан (W), цистеин (C) (в порядки убывания частоты), для кишечной палочки наиболее редки гистидин (H), триптофан(W) и цистеин (C). Таким образом, в протеомах обоих организмов наименее распостранены аминокислоты триптофан и цистеин.
  • Наиболее значимо различаются протеомы по содержанию лизина (K) и аспартата (D): лизина на 2,41% больше в протеоме E. coli, аспартата на 3,18% больше в протеоме H. marismortui, - соответственно, это самые большие отклонения в пользу одного и другого организмов.
  • В записях протеомов в явном виде не представлено пирролизина (O), с помощью команды compseq было показано его отсутствие в протеоме H. marismortui, в протеоме E. coli compseq обнаруживает 8 аминокислот, отмеченных как X, поскольку пирролизин присущ метаногенным археям, скорее всего он не входит в эти 8 остаков. Селеноцистеин (U) есть только у E. coli, всего лишь 3 ао.

Материалы и методы:

  • Протеомы были скачаны из банка UniProt Proteomes
  • ID протеомов, а также чило последовательностей в них были взяты из их записей в UniProt Proteomes (последнее также было проверено с помощью bash-команды grep -E -c "^>" [input_proteome]), общее число аминокислотных остатков в протеомах было посчитано с помощью bash-конвейера sed -r '/^>/d' [input_proteome] | sed '1i\>seq' | infoseq -only -length -filter, а затем проверено программой compseq.
  • Количества различных аминокислот в протеомах было посчитано программой wordcount (команда wordcount [input_proteome] -wordsize 1 stdout), с её же помощью выявлены наиболее редкие и частые аминокислоты протеомов.
  • Таблица создана с помощью python-скрипта, вызов python ~stepan_puhov/term2/linux/pr6/table.py ~stepan_puhov/term2/linux/pr6/ecoli.aa 'E. coli' ~stepan_puhov/term2/linux/pr6/archaea.aa 'H. marismortui'
Главная страница


© Степан Пухов

2018