Uniprot - Proteomes

Были рассмотрена протеомы двух организмов: Escherichia coli K12 и Mycoplasma gallisepticum S6. В Таблице 1 приведены данные, дающие основную информацию об этих протеомах.

E.coli K12 M.gallisepticum S6

Uniprot ID UP000000625 UP000018735

Число последовательностей 4306 815

Число остатков 1356195 294229

Таблица 1. Основные данные.

I. Расчет частот. Расчет частоты встречаемости букв (аминокислотных остатков, обозначенных однобуквенным кодом) производился с помощью программы PuTTY и комманды wordcount. Входными файлами являлись скачанные в формате fasta протеомы, выходными - файлы ods. Далее была проведена некоторая статистическая обработка данных. Ее результаты представлены в Таблице 2 и в файле ods.

остаток M.gallisepticum S6 E.coli K12 Разность, %

L 9,87 10,67 -0,8

K 8,92 4,41 4,51

I 8,33 6,01 2,32

N 8,02 3,95 4,08

S 7,06 5,8 1,26

V 5,92 7,07 -1,16

A 5,7 9,51 -3,81

E 5,69 5,76 -0,07

D 5,68 5,15 0,53

T 5,66 5,4 0,26

F 4,96 3,89 1,07

G 4,64 7,37 -2,73

Y 4,29 2,85 1,44

Q 4,22 4,44 -0,22

R 3,22 5,51 -2,29

P 3,22 4,43 -1,21

M 1,69 2,82 -1,13

H 1,48 2,27 -0,79

W 0,89 1,53 -0,65

C 0,54 1,16 -0,61

U 0 0 0

Таблица 2. Статистические данные.

II. Комментарии к таблице. Из таблицы видно, что 3 самые распространненые остатка у E.coli K12 - это L (лейцин), A (аланин) и G (глицин), а у M.gallisepticum S6 - L (лейцин), K (лизин) и I (изолейин). То есть совпадают они только лейцином. Причем разность встречаемости лизина в данных протеомах - максимальная (у M.gallisepticum S6 его больше на 4,51%). Наибольшую же разность в пользу E.coli K12 имеет аланин - 3,81%.

НАЗАД ➜