Практикум №7

На главную На страницу второго семестра

— — — — — — — —

Были скачаны протеомы Escherichia coli K12 и Streptococcus mutans UA159 в UniProt. Затем при помощи команды "grep -Ec '^>' [название файла]" было найдено количество последовательностей для каждого протеома, а общее количество аминокислот было получено при помощи команды "wordcount -wordsize=1 [название файла] stdout". Все эти данные представлены в таблице 1.

Таблица 1. Общие данные о протеомах
Организм Идентификатор протеома Количество последовательностей Количество аминокислот
Escherichia coli K12 UP000000625 4352 1353357
Streptococcus mutans SM6 UP000031411 1854 570857

Для рассчёта данных таблицы 2, где представлена частота встречаемости аминокислот в протеомах, был написан скрипт на Python. Для запуска программы нужно в качестве второго аргумента командной строки указать файл с количеством аминокислот в протеоме E. coli , а в качестве третьего - файл с количеством аминокислот в протеоме S. mutans.

Таблица 2. Даннные о частоте встречаемости аминокислот
Аминокислотный остаток Процент в протеоме S. mutans Процент в протеоме E. coli Разница
L 10.11 10.676 -0.566
I 7.725 6.011 1.714
A 7.516 9.507 -1.991
K 7.405 4.407 2.998
V 6.607 7.07 -0.463
E 6.424 5.762 0.662
G 6.308 7.366 -1.058
S 6.257 5.799 0.458
D 5.693 5.147 0.546
T 5.623 5.395 0.228
N 4.832 3.938 0.894
F 4.74 3.894 0.846
Q 4.086 4.443 -0.357
R 3.889 5.52 -1.631
Y 3.837 2.845 0.992
P 3.159 4.429 -1.27
M 2.417 2.825 -0.408
H 1.952 2.269 -0.317
W 0.869 1.532 -0.663
C 0.554 1.162 -0.608
U - 0 0

Как видно из таблицы 2, самые часто встречаемые аминокислоты в S. mutans - это лейцин, изолейцин и аланин, в то время как в E. coli - это лейцин, аланин и глицин. Самые редкие остатки S. mutans - это цистеин, триптофан и гистидин, а у E. coli - это триптофан, цистеин и гистидин, то есть отличаются лишь порядком следования. Для лизина проявляется наибольшая разница в пользу S. mutans , а наибольшая разница в пользу E. coli - у аланина (хотя в обоих организмах он входит в спиок трёх наиболее частых аминокислот).