Uniprot - Proteomes

Были рассмотрена протеомы двух организмов: Escherichia coli K12 и Mycoplasma gallisepticum S6. В Таблице 1 приведены данные, дающие основную информацию об этих протеомах.

E.coli K12M.gallisepticum S6
Uniprot IDUP000000625UP000018735
Число последовательностей4306815
Число остатков1356195294229

Таблица 1. Основные данные.

I. Расчет частот. Расчет частоты встречаемости букв (аминокислотных остатков, обозначенных однобуквенным кодом) производился с помощью программы PuTTY и комманды wordcount. Входными файлами являлись скачанные в формате fasta протеомы, выходными - файлы ods. Далее была проведена некоторая статистическая обработка данных. Ее результаты представлены в Таблице 2 и в файле ods.

остатокM.gallisepticum S6E.coli K12Разность, %
L9,8710,67-0,8
K8,924,414,51
I8,336,012,32
N8,023,954,08
S7,065,81,26
V5,927,07-1,16
A5,79,51-3,81
E5,695,76-0,07
D5,685,150,53
T5,665,40,26
F4,963,891,07
G4,647,37-2,73
Y4,292,851,44
Q4,224,44-0,22
R3,225,51-2,29
P3,224,43-1,21
M1,692,82-1,13
H1,482,27-0,79
W0,891,53-0,65
C0,541,16-0,61
U000

Таблица 2. Статистические данные.

II. Комментарии к таблице. Из таблицы видно, что 3 самые распространненые остатка у E.coli K12 - это L (лейцин), A (аланин) и G (глицин), а у M.gallisepticum S6 - L (лейцин), K (лизин) и I (изолейин). То есть совпадают они только лейцином. Причем разность встречаемости лизина в данных протеомах - максимальная (у M.gallisepticum S6 его больше на 4,51%). Наибольшую же разность в пользу E.coli K12 имеет аланин - 3,81%.



НАЗАД ➜
© <Рюмина Екатерина>, 2017