EMBROSS и протеомы.

В ходе данного практикума я познакомилась с несколькими командами из пакета программ EMBROSS, а также сравнила протеом Escherichia coli (strain K12) с протеомом Acidaminococcus fermentans DSM 20731.

С сайта Uniprot была получена последовательность белков, входящих в состав бактерии. Количество последовательностей было посчитано с помощью команд grep -c '>' coli.fasta и grep -c '>' fermentas.fasta, а потом сверено с данными на Uniprot. Полученные результаты представлены в таблице 1.

Таблица 1.
Краткая информация о протеомах.
Организм ID протеома Число последовательностей Число аминокислот
Escherichia coli (strain K12) (Strain: K12 / MG1655 / ATCC 47076) UP000000625 4352 1353357
Acidaminococcus fermentans (strain ATCC 25085 / DSM 20731 / VR4) UP000001902 2016 669530

С помощью команды wordcount -sequence coli.fasta -wordsize 1 -outfile colicount.fasta был получен файл с частотой каждой аминокислоты в протеоме вначале E. coli, а затем и A. fermentans. Далее с помощью программы Excel данные были обработаны. Файл можно скачать здесь . В таблице 2 приведены обработанные данные.

Таблица 2.
Сравнение встречаемости аминокислотных остатков в протеомах A. fermentans и E. coli.
Название остатка A. fermentans % E. coli % Разность %
L 10.151 10.676 -0.525
A 9.038 9.507 -0.469
G 8.165 7.366 0.799
V 7.309 7.07 0.239
E 6.522 5.762 0.76
K 5.95 4.407 1.543
I 5.818 6.011 -0.193
T 5.447 5.395 0.052
D 5.394 5.147 0.247
R 5.32 5.52 -0.2
S 5.044 5.799 -0.755
P 4.255 4.429 -0.174
F 3.864 3.894 -0.03
Q 3.697 4.443 -0.746
N 3.528 3.938 -0.41
Y 3.255 2.845 0.41
M 2.87 2.825 0.045
H 2.025 2.269 -0.244
C 1.313 1.162 0.151
W 1.037 1.532 -0.495

Три самые частые (лейцин, аланин и глицин) и три самые редкие аминокислоты (гистидин, цистеин и триптофан) у объектов совпадают. Стоит отметить, что чаще всего встречаемые аминокислоты - это аминокислотные остатки с алифатическими неполярными радикалами, тогда как триптофан и гистидин имеют ароматический радикал, а цистеин способен образовывать дисульфидные мостики. Самая большая разница в пользу A. fermentans наблюдается у лизина(1.543%). Тогда как серина в протеоме E. coli больше на 0.755%. Поэтому можно сказать, что частота встречаемости аминокислот у данных объектов сильно не различается.