Практикум 7: Протеомы и EMBOSS
1. Частоты остатков в протеомах
Протеом - это совокупность всех белков организма.
Практикум посвящен изучению и сравнению протеомов двух бактерий: E.Coli (stain K12) и Neisseria Gonorrhoeae (белок из протеома этой бактерии
подробно описывался в предыдущем практикуме ). В первую очередь я скачала протеомы вышеуказанных батерий в FASTA-формате
с ресурса Uniprot, для поиска организма я использовала "advanced search" по таксономии. Поскольку файлы скачались в "GZ" формате их необходимо было распаковать.
С помощью программ wordcount и Excel я получила следующи результаты:
Организм | E.Coli (stain K12) | Neisseria Gonorrhoeae |
Идентификатор протеома Proteome ID | up000000625 | UP000000535 |
Число последовательностей | 4306 | 2106 |
Число остатков | 1356195 | |
С помощью команды wordcount из EMBOSS (the European Molecular Biology Open Software Suite) я посчитала частоты букв в протеомах,
после чего проанализировала результат в Excel (испльзовались команды СУММ, ВПР, СЦЕПИТЬ). В результате я получила следующую таблицу:
Аминокислотный остаток | Neisseria Gonorrhoeae,% | E. coli (K12),% | Разность, % |
A | 10,281 | 9,514 | 0,767 |
C | 1,103 | 1,158 | -0,055 |
D | 5,267 | 5,151 | 0,116 |
E | 6,163 | 5,762 | 0,4014 |
F | 4,161 | 3,892 | 0,2703 |
G | 7,896 | 7,375 | 0,5219 |
H | 2,162 | 2,267 | -0,105 |
I | 5,734 | 6,011 | -0,276 |
K | 5,674 | 4,406 | 1,268 |
L | 9,735 | 10,672 | -0,937 |
M | 2,503 | 2,820 | -0,317 |
N | 4,007 | 3,945 | 0,062 |
P | 4,331 | 4,426 | -0,0959 |
Q | 3,838 | 4,439 | -0,6013 |
R | 5,721 | 5,511 | 0,210 |
S | 5,424 | 5,802 | -0,378 |
T | 5,069 | 5,399 | -0,330 |
U | 0 | 0,001 | -0,001 |
V | 6,781 | 7,073 | -0,293 |
W | 1,181 | 1,531 | -0,3497 |
Y | 2,966 | 2,845 | 0,121 |
Выводы: Три самых частых аминокислотных остатка у E.Coli это аланин(9,54%), лейцин(10,672%) и глицин(7,375). У N. Gonorrhoeae это те же самые аминокислотные остатки.
Наиболее редкие: у E.Coli это цистеин(1,158), триптофан(1,531) и гистидин(2,267). Как и у N. Gonorrhoeae.
Наибольшая разница в пользу E. Coli в содержании лейцина (0,937), а в пользу N. Gonorrhoeae - в содержании лизина(1,268).
Источники: http://www.uniprot.org/proteomes/UP000000625
|