На главную На страницу второго семестра
— — — — — — — —
Были скачаны протеомы Escherichia coli K12 и Streptococcus mutans UA159 в UniProt. Затем при помощи команды "grep -Ec '^>' [название файла]" было найдено количество последовательностей для каждого протеома, а общее количество аминокислот было получено при помощи команды "wordcount -wordsize=1 [название файла] stdout". Все эти данные представлены в таблице 1.
Организм | Идентификатор протеома | Количество последовательностей | Количество аминокислот |
---|---|---|---|
Escherichia coli K12 | UP000000625 | 4352 | 1353357 |
Streptococcus mutans SM6 | UP000031411 | 1854 | 570857 |
Для рассчёта данных таблицы 2, где представлена частота встречаемости аминокислот в протеомах, был написан скрипт на Python. Для запуска программы нужно в качестве второго аргумента командной строки указать файл с количеством аминокислот в протеоме E. coli , а в качестве третьего - файл с количеством аминокислот в протеоме S. mutans.
Аминокислотный остаток | Процент в протеоме S. mutans | Процент в протеоме E. coli | Разница |
---|---|---|---|
L | 10.11 | 10.676 | -0.566 |
I | 7.725 | 6.011 | 1.714 |
A | 7.516 | 9.507 | -1.991 |
K | 7.405 | 4.407 | 2.998 |
V | 6.607 | 7.07 | -0.463 |
E | 6.424 | 5.762 | 0.662 |
G | 6.308 | 7.366 | -1.058 |
S | 6.257 | 5.799 | 0.458 |
D | 5.693 | 5.147 | 0.546 |
T | 5.623 | 5.395 | 0.228 |
N | 4.832 | 3.938 | 0.894 |
F | 4.74 | 3.894 | 0.846 |
Q | 4.086 | 4.443 | -0.357 |
R | 3.889 | 5.52 | -1.631 |
Y | 3.837 | 2.845 | 0.992 |
P | 3.159 | 4.429 | -1.27 |
M | 2.417 | 2.825 | -0.408 |
H | 1.952 | 2.269 | -0.317 |
W | 0.869 | 1.532 | -0.663 |
C | 0.554 | 1.162 | -0.608 |
U | - | 0 | 0 |
Как видно из таблицы 2, самые часто встречаемые аминокислоты в S. mutans - это лейцин, изолейцин и аланин, в то время как в E. coli - это лейцин, аланин и глицин. Самые редкие остатки S. mutans - это цистеин, триптофан и гистидин, а у E. coli - это триптофан, цистеин и гистидин, то есть отличаются лишь порядком следования. Для лизина проявляется наибольшая разница в пользу S. mutans , а наибольшая разница в пользу E. coli - у аланина (хотя в обоих организмах он входит в спиок трёх наиболее частых аминокислот).