EMBROSS и протеомы.
В ходе данного практикума я познакомилась с несколькими командами из пакета программ EMBROSS, а также сравнила протеом Escherichia coli (strain K12) с протеомом Acidaminococcus fermentans DSM 20731.
С сайта Uniprot была получена последовательность белков, входящих в состав бактерии. Количество последовательностей было посчитано с помощью команд grep -c '>' coli.fasta и grep -c '>' fermentas.fasta, а потом сверено с данными на Uniprot. Полученные результаты представлены в таблице 1.
Организм | ID протеома | Число последовательностей | Число аминокислот |
---|---|---|---|
Escherichia coli (strain K12) (Strain: K12 / MG1655 / ATCC 47076) | UP000000625 | 4352 | 1353357 |
Acidaminococcus fermentans (strain ATCC 25085 / DSM 20731 / VR4) | UP000001902 | 2016 | 669530 |
С помощью команды wordcount -sequence coli.fasta -wordsize 1 -outfile colicount.fasta был получен файл с частотой каждой аминокислоты в протеоме вначале E. coli, а затем и A. fermentans. Далее с помощью программы Excel данные были обработаны. Файл можно скачать здесь . В таблице 2 приведены обработанные данные.
Название остатка | A. fermentans % | E. coli % | Разность % |
L | 10.151 | 10.676 | -0.525 |
A | 9.038 | 9.507 | -0.469 |
G | 8.165 | 7.366 | 0.799 |
V | 7.309 | 7.07 | 0.239 |
E | 6.522 | 5.762 | 0.76 |
K | 5.95 | 4.407 | 1.543 |
I | 5.818 | 6.011 | -0.193 |
T | 5.447 | 5.395 | 0.052 |
D | 5.394 | 5.147 | 0.247 |
R | 5.32 | 5.52 | -0.2 |
S | 5.044 | 5.799 | -0.755 |
P | 4.255 | 4.429 | -0.174 |
F | 3.864 | 3.894 | -0.03 |
Q | 3.697 | 4.443 | -0.746 |
N | 3.528 | 3.938 | -0.41 |
Y | 3.255 | 2.845 | 0.41 |
M | 2.87 | 2.825 | 0.045 |
H | 2.025 | 2.269 | -0.244 |
C | 1.313 | 1.162 | 0.151 |
W | 1.037 | 1.532 | -0.495 |
Три самые частые (лейцин, аланин и глицин) и три самые редкие аминокислоты (гистидин, цистеин и триптофан) у объектов совпадают. Стоит отметить, что чаще всего встречаемые аминокислоты - это аминокислотные остатки с алифатическими неполярными радикалами, тогда как триптофан и гистидин имеют ароматический радикал, а цистеин способен образовывать дисульфидные мостики. Самая большая разница в пользу A. fermentans наблюдается у лизина(1.543%). Тогда как серина в протеоме E. coli больше на 0.755%. Поэтому можно сказать, что частота встречаемости аминокислот у данных объектов сильно не различается.