Практикум 7: Протеомы и EMBOSS

1. Частоты остатков в протеомах
Протеом - это совокупность всех белков организма.
Практикум посвящен изучению и сравнению протеомов двух бактерий: E.Coli (stain K12) и Neisseria Gonorrhoeae (белок из протеома этой бактерии подробно описывался в предыдущем практикуме ). В первую очередь я скачала протеомы вышеуказанных батерий в FASTA-формате с ресурса Uniprot, для поиска организма я использовала "advanced search" по таксономии. Поскольку файлы скачались в "GZ" формате их необходимо было распаковать. С помощью программ wordcount и Excel я получила следующи результаты:
Организм E.Coli (stain K12)Neisseria Gonorrhoeae
Идентификатор протеома Proteome ID up000000625 UP000000535
Число последовательностей 4306 2106
Число остатков 1356195


С помощью команды wordcount из EMBOSS (the European Molecular Biology Open Software Suite) я посчитала частоты букв в протеомах, после чего проанализировала результат в Excel (испльзовались команды СУММ, ВПР, СЦЕПИТЬ). В результате я получила следующую таблицу:
Аминокислотный остаток Neisseria Gonorrhoeae,% E. coli (K12),% Разность, %
A 10,281 9,514 0,767
C 1,103 1,158 -0,055
D 5,267 5,151 0,116
E 6,163 5,762 0,4014
F 4,161 3,892 0,2703
G 7,8967,375 0,5219
H 2,1622,267 -0,105
I 5,734 6,011 -0,276
K 5,674 4,406 1,268
L 9,73510,672 -0,937
M 2,5032,820 -0,317
N 4,007 3,9450,062
P 4,3314,426 -0,0959
Q 3,8384,439 -0,6013
R 5,7215,511 0,210
S 5,4245,802 -0,378
T 5,0695,399 -0,330
U 00,001 -0,001
V 6,781 7,073-0,293
W 1,181 1,531-0,3497
Y 2,966 2,845 0,121

Выводы:
Три самых частых аминокислотных остатка у E.Coli это аланин(9,54%), лейцин(10,672%) и глицин(7,375). У N. Gonorrhoeae это те же самые аминокислотные остатки.
Наиболее редкие: у E.Coli это цистеин(1,158), триптофан(1,531) и гистидин(2,267). Как и у N. Gonorrhoeae.
Наибольшая разница в пользу E. Coli в содержании лейцина (0,937), а в пользу N. Gonorrhoeae - в содержании лизина(1,268). Источники: http://www.uniprot.org/proteomes/UP000000625

Назад