EMBOSS и протеомы

Описание работы

C помощью пакета EMBOSS и команд Bash были собраны некоторые данные по протеомам бактерий Escherichia coli K-12 и Cupriavidus necator H-16. Для этого использовались скачанные в fasta-формате протеомы из базы данных Uniprot. Подсчет числа последовательностей производился командой grep '>' CuNe(EsCo).fasta | wc -l , число аминокислот было получено как результат работы скрипта на Python

Cupriavidus necator H-16

-Идентификатор протеома: UP000008210

-Число последовательностей: 6614

-Число аминокислот: 2157412

Escherichia coli K-12

-Идентификатор протеома: UP000000625

-Число последовательностей: 4352

-Число аминокислот: 1353354

Таблица 1. Частоты встречаемости аминокислот в протеомах E. coli и C. necator
АК остаток Процент содержания у Cupriavidus necator Процент содержания у Escherichia coli Разность
A 13.368 9.507 3.861
L 10.511 10.676 -0.165
G 8.512 7.366 1.146
V 7.629 7.07 0.559
R 7.309 5.521 1.788
P 5.451 4.429 1.022
D 5.223 5.147 0.076
S 5.136 5.799 -0.663
T 5.133 5.395 -0.262
E 5.131 5.762 -0.631
I 4.344 6.012 -1.668
Q 3.838 4.443 -0.605
F 3.436 3.894 -0.458
K 2.85 4.407 -1.557
N 2.53 3.938 -1.408
M 2.529 2.825 -0.296
Y 2.375 2.845 -0.47
H 2.303 2.269 0.034
W 1.39 1.532 -0.142
C 1.0 1.162 -0.162

Наиболее часто встречающиеся остатки АК у Cupriavidus necator H-16:

A(13.368%), L(10.511%), G(8.512%)

Наиболее часто встречающиеся остатки АК у Escherichia coli K-12:

L(10.676%), A(9.507%), G(7.366%)

Вернуться на главную страницу