Практикум 7. EMBOSS и протеомы.
Частоты остатков в протеомах.
Были загружены файлы протеомов бактерий Escherichia coli (strain K12) и Zymomonas mobilis subsp. mobilis (strain ATCC 31821 / ZM4 / CP4) в fasta-формате (E.coli и Z. mobilis).
Данные о количестве последовательностей в fasta-файле получены с помощью команд Bash "grep -c '>' ecoli.fasta" и "grep -c '>' zymmo.fasta" и указаны в Таблице 1.
Организм | Идентификатор протеома | Количество последовательностей | Количество аминокислот |
---|---|---|---|
Zymomonas mobilis subsp. mobilis (strain ATCC 31821 / ZM4 / CP4) | UP000001173 | 1779 | 599255 |
Escherichia coli (strain K12) | UP000000625 | 4352 | 1353357 |
Частота встречаемости аминокислотных остатков в протеомах бактерий расчитана и приведена в формат html-таблицы с помощью сценария Python3.6. Предварительно на основе fasta-файлов протеомов были созданы wordcount-файлы (E. coli и Z. mobilis) при помощи команд пакета EMBOSS: "wordcount ecoli.fasta -wordsize 1 -outfile ecoli.wordcount" и "wordcount zymmo.fasta -wordsize 1 -outfile zymmo.wordcount".
Полученные из сценария данные о суммарном количестве аминокислотных остатков занесены выше в Таблицу 1. Частоты остатков в протеомах указаны в Таблице 2.
Остаток | Содержание в протеоме Z. mobilis | Содержание в протеоме E. coli | Разность |
---|---|---|---|
A | 10.183% | 9.507% | 0.676% |
L | 9.992% | 10.676% | -0.684% |
G | 7.461% | 7.366% | 0.095% |
S | 6.669% | 5.799% | 0.87% |
I | 6.532% | 6.011% | 0.521% |
V | 6.225% | 7.07% | -0.845% |
D | 5.722% | 5.147% | 0.575% |
R | 5.694% | 5.52% | 0.174% |
E | 5.666% | 5.762% | -0.096% |
T | 5.059% | 5.395% | -0.336% |
K | 5.058% | 4.407% | 0.651% |
P | 4.737% | 4.429% | 0.308% |
F | 3.887% | 3.894% | -0.007% |
Q | 3.807% | 4.443% | -0.636% |
N | 3.787% | 3.938% | -0.151% |
Y | 2.651% | 2.845% | -0.194% |
M | 2.422% | 2.825% | -0.403% |
H | 2.335% | 2.269% | 0.066% |
W | 1.277% | 1.532% | -0.255% |
C | 0.835% | 1.162% | -0.327% |
В Таблице 2 не были указаны 3 остатка селеноцистеина (U) у E. coli. Наиболее часто встречающиеся остатки у обеих бактерий - аланин (A), лейцин (L), глицин (G). Самыми редкими в обоих протемах являются цистеин (C), триптофан (W) и гистидин (H). Сильнее всего различаются содержания серина (S, 0.87%) в пользу Z. mobilis и валина (V, -0.845%) в пользу E. coli.
Можно заключить, что в целом содержания аминокислотных остатков E. coli и Z. mobilis имеют мало отличий между собой.