Учебный сайт Орлова Артёма

Практикум 7. EMBOSS и протеомы.

Частоты остатков в протеомах.

Были загружены файлы протеомов бактерий Escherichia coli (strain K12) и Zymomonas mobilis subsp. mobilis (strain ATCC 31821 / ZM4 / CP4) в fasta-формате (E.coli и Z. mobilis).

Данные о количестве последовательностей в fasta-файле получены с помощью команд Bash "grep -c '>' ecoli.fasta" и "grep -c '>' zymmo.fasta" и указаны в Таблице 1.

Таблица 1
Организм Идентификатор протеома Количество последовательностей Количество аминокислот
Zymomonas mobilis subsp. mobilis (strain ATCC 31821 / ZM4 / CP4) UP000001173 1779 599255
Escherichia coli (strain K12) UP000000625 4352 1353357

Частота встречаемости аминокислотных остатков в протеомах бактерий расчитана и приведена в формат html-таблицы с помощью сценария Python3.6. Предварительно на основе fasta-файлов протеомов были созданы wordcount-файлы (E. coli и Z. mobilis) при помощи команд пакета EMBOSS: "wordcount ecoli.fasta -wordsize 1 -outfile ecoli.wordcount" и "wordcount zymmo.fasta -wordsize 1 -outfile zymmo.wordcount".

Полученные из сценария данные о суммарном количестве аминокислотных остатков занесены выше в Таблицу 1. Частоты остатков в протеомах указаны в Таблице 2.

Таблица 2
Остаток Содержание в протеоме Z. mobilis Содержание в протеоме E. coli Разность
A 10.183% 9.507% 0.676%
L 9.992% 10.676% -0.684%
G 7.461% 7.366% 0.095%
S 6.669% 5.799% 0.87%
I 6.532% 6.011% 0.521%
V 6.225% 7.07% -0.845%
D 5.722% 5.147% 0.575%
R 5.694% 5.52% 0.174%
E 5.666% 5.762% -0.096%
T 5.059% 5.395% -0.336%
K 5.058% 4.407% 0.651%
P 4.737% 4.429% 0.308%
F 3.887% 3.894% -0.007%
Q 3.807% 4.443% -0.636%
N 3.787% 3.938% -0.151%
Y 2.651% 2.845% -0.194%
M 2.422% 2.825% -0.403%
H 2.335% 2.269% 0.066%
W 1.277% 1.532% -0.255%
C 0.835% 1.162% -0.327%

В Таблице 2 не были указаны 3 остатка селеноцистеина (U) у E. coli. Наиболее часто встречающиеся остатки у обеих бактерий - аланин (A), лейцин (L), глицин (G). Самыми редкими в обоих протемах являются цистеин (C), триптофан (W) и гистидин (H). Сильнее всего различаются содержания серина (S, 0.87%) в пользу Z. mobilis и валина (V, -0.845%) в пользу E. coli.

Можно заключить, что в целом содержания аминокислотных остатков E. coli и Z. mobilis имеют мало отличий между собой.