Были скачаны протеомы Escherichia coli K12 и Thioalkalivibrio nitratireducens DSM 14787 в UniProt. Затем при помощи команды "grep -Ec '^>' [название файла]" было найдено количество последовательностей для каждого протеома, а общее количество аминокислот было получено при помощи команды "wordcount -wordsize=1 [название файла] stdout". Все эти данные представлены в таблице 1.
Организм | Идентификатор протеома | Количество последовательностей | Количество аминокислот |
---|---|---|---|
Escherichia coli K12 | UP000000625 | 4391 | 1354354 |
Thioalkalivibrio nitratireducens DSM 14787 | UP000031411 | 3764 | 1108119 |
Аминокислота | E. coli | T. nitratireducens | Разница |
L | 10,67638151 | 11,16802437 | -0,4916428655 |
A | 9,505343507 | 11,7110166 | -2,20567309 |
G | 7,363805918 | 8,48347515 | -1,119669232 |
V | 7,069348191 | 7,449921895 | -0,3805737036 |
I | 6,012460553 | 4,312352735 | 1,700107818 |
S | 5,801068258 | 4,707617142 | 1,093451116 |
E | 5,759793968 | 6,364388662 | -0,604594694 |
R | 5,522780602 | 8,995333534 | -3,472552931 |
T | 5,394158396 | 4,776562806 | 0,6175955898 |
D | 5,145700459 | 5,82951831 | -0,6838178504 |
Q | 4,441084089 | 3,469302485 | 0,9717816041 |
P | 4,428753487 | 5,69514646 | -1,266392973 |
K | 4,407931752 | 1,977043982 | 2,43088777 |
N | 3,940107239 | 2,196695481 | 1,743411758 |
F | 3,894107449 | 3,420029798 | 0,4740776508 |
Y | 2,845489436 | 2,242990148 | 0,6024992881 |
M | 2,827030451 | 2,201117389 | 0,6259130624 |
H | 2,269642944 | 2,53961894 | -0,2699759957 |
W | 1,531726565 | 1,521136268 | 0,01059029699 |
C | 1,163063719 | 0,9387078464 | 0,2243558726 |
U | 0,0002215078185 | 0 | 0,0002215078185 |
Как видно из таблицы 2, самые часто встречаемые аминокислоты у E.coli - это лейцин, аланин и глицин, в то время как у T. nitratireducens - это лейцин, аланин и аргинин. Самые редкие остатки T. nitratireducens - это цистеин, триптофан и лизин, а у E. coli - это триптофан, цистеин и гистидин. Для аргинина проявляется наибольшая разница в пользу T. nitratireducens , а наибольшая разница в пользу E. coli - у лизина.
Данные для таблицы 2 были посчитаны с помощью google-таблиц.