Из базы данных Uniprot Proteomes были скачаны протеомы Amphibacillus xylanus (идентификатор протеома UP000006294) и Escherichia coli (идентификатор протеома UP000000625)
. С помощью команды "grep -c '>' filename.fasta" было подсчитано количество последовательностей в каждом протеоме (2384 для Amphibacillus xylanus
и 4352 для Escherichia coli). В последствии при помощи программы на Python было подсчитано общее число аминокислот (713264 для Amphibacillus xylanus
и 1353354 для Escherichia coli). Далее при помощи команды 'wordcount filename.fasta' с последующим вводом wordsize=1 'outputfilename.txt' были получены файлы с перечисленными аминокислотами.
На Python была написана программа, которая создаёт готовую для вставки на сайт html-таблицу и записывает её в текстовый файл. Таблица содержит информацию о
процентном содержании аминокислот в протеомах, аминокислоты отсортированы по количеству в протеоме Amphibacillus xylanus
Аминокислота | Процент в протеоме Amphibacillus | Процент в геноме Escherichia | Разность |
---|---|---|---|
L | 9.75 | 10.68 | -0.93 |
I | 8.52 | 6.01 | 2.51 |
E | 7.5 | 5.76 | 1.74 |
V | 6.73 | 7.07 | -0.34 |
A | 6.54 | 9.51 | -2.97 |
K | 6.51 | 4.41 | 2.1 |
G | 6.25 | 7.37 | -1.12 |
D | 5.86 | 5.15 | 0.71 |
S | 5.76 | 5.8 | -0.04 |
T | 5.5 | 5.39 | 0.11 |
N | 4.78 | 3.94 | 0.84 |
Q | 4.4 | 4.44 | -0.04 |
F | 4.36 | 3.89 | 0.47 |
R | 4.23 | 5.52 | -1.29 |
Y | 3.83 | 2.84 | 0.99 |
P | 3.42 | 4.43 | -1.01 |
M | 2.47 | 2.83 | -0.36 |
H | 2.1 | 2.27 | -0.17 |
W | 0.91 | 1.53 | -0.62 |
C | 0.57 | 1.16 | -0.59 |
Три самых частых у Amphibacillus xylanus - LIE, тогда как у Escherichia coli - LAG. Интересно, что при этом изолейцин имеет самую большую разницу в пользу Amphibcillus, а аланин - в пользу E. coli. Не могу предположить, что это может значить, так как данные аминокислоты схожи по свойствам. Почти все остальные отличия (за исключением глутаминовой кислоты) в 2 или более раз меньше этих. Три самые редкие аминокислоты совпадают в обоих организмах - HWC. Причём процент C у E.coli более чем в 2 раза больше, чем у Amphibacillus xylanus - можно предположить, что в её протеоме значительно больше дисульфидных мостиков.