Протеом E. coli K 12: ID UP000000625, 4313 последовательностей, 1351630 ао
Протеом H. marismortui ATCC 43049: ID UP000001169, 4234 последовательностей, 1200597 ао
Таблица сравнения протеомов
Аминокислота | E. coli, % | H. marismortui, % | Различия |
A | 9.51148 | 10.41482 | -0.90334 |
C | 1.16089 | 0.75712 | 0.40377 |
D | 5.14912 | 8.32636 | -3.17724 |
E | 5.76593 | 8.08964 | -2.32372 |
F | 3.89263 | 3.25413 | 0.63850 |
G | 7.37043 | 8.27805 | -0.90761 |
H | 2.26771 | 2.00525 | 0.26245 |
I | 6.00978 | 4.38648 | 1.62330 |
K | 4.40572 | 2.00117 | 2.40455 |
L | 10.67570 | 8.81037 | 1.86534 |
M | 2.82252 | 1.87782 | 0.94470 |
N | 3.93688 | 2.58630 | 1.35058 |
O | 0.00000 | 0.00000 | 0.00000 |
P | 4.42828 | 4.59055 | -0.16227 |
Q | 4.44338 | 3.12395 | 1.31943 |
R | 5.51860 | 6.11421 | -0.59561 |
S | 5.79663 | 5.95487 | -0.15824 |
T | 5.39401 | 6.91556 | -1.52155 |
U | 0.00022 | 0.00000 | 0.00022 |
V | 7.07302 | 8.64845 | -1.57543 |
W | 1.53185 | 1.14710 | 0.38476 |
Y | 2.84464 | 2.71781 | 0.12682 |
Комментарии к таблице:
-
В протеомах обоих организмов наиболее распостранены гидрофобные аминокислоты аланин и лейцин. В составе протеома H. marismortui
наиболее распространены аланин (A), лейцин (L) и валин (V), а у E. coli самыми распостранёнными
остатками являются лейцин (L), аланин (A) и глицин (G).
-
В протеомах обоих организмов наименее распостранены
аминокислоты триптофан и цистеин. Самыми редкими аминокислотами у археи являются метионин (M),
триптофан (W), цистеин (C), а у бактерии - гистидин (H), триптофан(W) и
цистеин (C).
-
Наиболее значимо различаются протеомы по содержанию лизина (K) и аспартата (D):
лизина на 2,41% больше в протеоме E. coli, аспартата на 3,18% больше
в протеоме H. marismortui.
-
В записях протеомов в явном виде не представлено пирролизина (O), с помощью команды
compseq было показано его отсутствие в протеоме H. marismortui, в протеоме
E. coli compseq обнаруживает 8 аминокислот, отмеченных как X, поскольку
пирролизин свойственен метаногенным археям, скорее всего он не входит в эти 8 остаков.
Селеноцистеин (U) есть только у E. coli, всего 3 ао.
Материалы и методы:
- Протеомы были скачаны из банка UniProt Proteomes.
- Подсчет количества записей в геноме был произведен с помощью команды grep -c ">" Ecoli.fasta. Команда grep служит для поиска строк, которые содержат заданный пользователем образец.
Опция -c позволяет вывести не строки, содержащие заданный образец, а их количество.
Анализ содержания аминокислотных остатков в геноме Escherichia coli был произведен с помощию команды
wordcount -sequence "Ecoli.fasta" -wordsize 1 -outfile "Ecoli_ak.wordcount". wordcount - команда из пакета EMBOSS
для подсчета слов в молекулярных последовательностях. После -sequence указывается ссылка на анализируемую последовательность,
-wordsize указывает на количество символов в одном слове. После -outfile в кавычках указывается имя выходного файла, в который
будет записан результат работы.
- Таблица создана вручную.
|