Практикум 7
-
Задание 1
Proteom ID | Название организма | Количество белков | Количество остатков |
UP000000625 | Escherichia coli K12 | 4306 | 1356195 |
UP000007095 | Burkholderia sp. CCGE1001 | 6403 | 2063536 |
В задании я рассматривал протеом своей бактерии Burkholderia sp. CCGE1001 и Escherichia coli K12. Общая информация о протеомах представлена в таблице выше.
Oстаток | Burkholderia sp. CCGE1001, % | Escherihia coli, % | Разность, % |
A | 12.96 | 9.51 | 3.45 |
L | 10.21 | 10.67 | 0.47 |
G | 8.16 | 7.37 | 0.78 |
V | 7.70 | 7.07 | 0.63 |
R | 7.04 | 5.51 | 1.53 |
S | 5.77 | 5.80 | 0.03 |
T | 5.33 | 5.40 | 0.07 |
D | 5.31 | 5.15 | 0.16 |
E | 5.20 | 5.76 | 0.56 |
P | 5.08 | 4.43 | 0.66 |
I | 4.59 | 6.01 | 1.42 |
F | 3.67 | 3.89 | 0.23 |
Q | 3.60 | 4.44 | 0.84 |
K | 3.10 | 4.41 | 1.31 |
N | 2.86 | 3.95 | 1.09 |
Y | 2.41 | 2.85 | 0.44 |
H | 2.36 | 2.27 | 0.09 |
M | 2.35 | 2.82 | 0.47 |
W | 1.36 | 1.53 | 0.18 |
C | 0.95 | 1.16 | 0.21 |
Таблица была получена с помощью программы на языке Python и функции Excel "сцепить". Программы запускается в командной строке "python emb.py 'имя файла встречаемости моей бактерии' 'имя файла встречаемости другой бактерии' 'имя выходного файла'", пример - "python emb.py
a.txt b.txt out.txt". Файлы встречаемости получены при помощи программы EMBOSS wordcount. Скрипт, выходной файл, файл Excel.
У обоих бактерий в протеоме чаще всего встречаются аминокислоты аланин, глицин и лейцин. Самыми редкими являются триптофан, цистеин, гистидин E.coli и метионин у Burkholderia.
Различие во встречаемости аминокислотных остатков не превышает 1,5%, но есть исключение - содержание аланина у Burkholderia на 3,5% превышает таковое у E.coli. У E.coli же почти на 1,5% больше содержание изолейцина.
Страница находится на стадии разработки
© Poddyakov Ivan 2016-2017