Практикум 8 Протеомы и Emboss

Протеом Escherichia coli MG1655. Идентификатор UP000000625. Число последовательностей - 4306. Число аминокислотных остатков - 1356086.

Протеом Ruminiclostridium thermocellum DSM 2360. Идентификатор UP0000004132. Число последовательностей - 3091. Число аминокислотных остатков - 983362.

Остаток Процент остатка в протеоме Escherichia coli MG1655 Процент остатка в протеоме Ruminiclostridium thermocellum DSM 2360 Разность процентов
L 10,6726% 6,2950% 4,3776%
A 9,5154% 4,6582% 4,8572%
G 7,3746%4,9035% 2,4712%
V 7,0734% 5,2495%1,8239%
I 6,0103%6,1613% -0,1510%
S 5,8023%4,3985% 1,4038%
E 5,7628%5,4876% 0,2752%
R 5,5110% 3,0818%2,4292%
T 5,3991% 3,6478%1,7513%
D 5,1510% 4,1486% 1,0024%
Q 4,4401% 1,8291% 2,6110%
P 4,4254% 2,4730%1,9524%
K 4,4061% 5,8060% -1,4000%
N 3,9454%3,8920% 0,0534%
F 3,8905% 3,1096%0,7809%
Y 2,8453% 3,0370%-0,1917%
M 2,8193% 1,8367% 0,9826%
H 2,2664% 1,0184%1,2480%
W 1,5312% 0,6262% 0,9050%
C 1,1576% 0,8550%0,3026%
U 0,0002% 0,0000% 0,0002%

Три самых часто встречающихся остатка в протеоме Escherichia coli MG1655 - Лейцин, Аланин, Глицин. А в протеоме Ruminiclostridium thermocellum DSM 2360 - Лейцин, Изолейцин, Лизин. Три самых редко встречающихся остатка в протеоме Escherichia coli MG1655 - Триптофан, Цистеин, Селеноцистеин. А в протеоме Ruminiclostridium thermocellum DSM 2360 селеноцистеин не встречается совсем, и наиболее редкие - Гистидин, Цистеин, Триптофан. Наибольшая по абсолютной величине разница 4,8572% в частотах в аланине.

Ссылки:

На главную


© Кузнецова Ксения, 2015