Из базы Uniprot Proteoms были скачаны протеомы двух бактерий: Escherichia coli K12 и Sphingobium japonicum ut26s, оба референсные. После, с помощью команды 'grep -c ">" filename' были посчитаны количества последовательностей, а с помощью команды 'wordcount filename', параметром '1' в wordcount и вводом имени выходного файла, была получена информация о вхождении каждой отдельной аминокислоты в протемы.
Организм | Идентификатор протеома | Количество последовательностей | Количество аминокислот |
---|---|---|---|
Sphingobium japonicum ut26s | UP000007753 | 4347 | 1 313 855 |
Escherichia coli K-12 | UP000000625 | 4352 | 1353357 |
Программа, составляющая табличку
На языке python был написан скрипт, считывающий файлов с информацией об аминокислотах в 2ух протемах и состовляющий сравнивающий ее. Информация выдается в виде html таблицы.
Аминокислотный остаток | Процент в геноме Sphingobium japonicum | Процент в геноме Escherichia | разность |
---|---|---|---|
E | 5.352954 | 5.762264 | -0.409310 |
Y | 2.201767 | 2.844926 | -0.643159 |
W | 1.420858 | 1.532116 | -0.111258 |
A | 13.204892 | 9.507174 | 3.697718 |
D | 5.945562 | 5.146905 | 0.798657 |
S | 5.345267 | 5.799135 | -0.453868 |
V | 6.908911 | 7.070344 | -0.161434 |
C | 0.811430 | 1.162073 | -0.350644 |
M | 2.556601 | 2.825271 | -0.268670 |
F | 3.526648 | 3.894390 | -0.367742 |
G | 9.000163 | 7.366127 | 1.634036 |
L | 9.980485 | 10.676266 | -0.695782 |
K | 2.964409 | 4.406967 | -1.442559 |
R | 7.664017 | 5.520495 | 2.143523 |
Q | 3.209185 | 4.442730 | -1.233546 |
T | 4.899555 | 5.394512 | -0.494957 |
N | 2.546706 | 3.938281 | -1.391575 |
H | 2.069256 | 2.269468 | -0.200212 |
P | 5.346637 | 4.428839 | 0.917798 |
I | 5.044701 | 6.011496 | -0.966795 |
U | 0.000000 | 0.000222 | -0.000222 |
Из таблицы 2 видно, что наиболее часто встречаются аминокислоты A, L и G. При этом наибольшая разность наблюдается в количестве аминокислоты A, которая является самой распространенной. Реже всего встречаются аминокислота U, которая вообще не наблюдается в геноме Sphingobium japonicum, а в геноме Escherichia coli ее количество составляет менее 1%. Также редковстречаемыми являются аминокислоты C и W.
Главная страница