В данной работе был проанализирован скачанный с сайта Uniprot протеом бактерии Arthrobacter sp. A3, один из белков которой был описан ранее. Протеом - это набор белков, который экспрессируется данным организмом. Большинство протеомов Uniprot основаны на продуктах трансляции полного секвенированного генома и помимо хромосом включают последовательности, полученные от плазмид или из геномов органелл, которые встречаются в определенном организме. На данном сайте Вы можете найти протеомы, полученные как результат трансляции полностью отсеквенированного генома организма [1].
Arthrobacter sp. A3 относится к роду Arthrobacter, семейству Micrococcaceae, порядку Actinomycetales, классу Actinobacteria, типу Actinobacteria, царству Bacteria. На сегодняшний день, является представителем изолированной и неописанной популяции Arthrobacter, которая, по предварительным данным, выделяется в отдельный вид, название которому пока не было дано. Штаммы рода Arthrobacter широко распространены в окружающей среде (в частности в почве) и выделяются из клинического материала людей при бактериемии, различных инфекционных процессах [2]. С сайта Uniprot были скачаны протеомы организмов Arthrobacter sp. A3 и Escherichia coli (штамма K12), для того чтобы провести анализ частоты встречаемости аминокислотных остатков в двух протеомах. В Таблице 1 приведена общая информация о данных протеомах.
Таблица 1. Информация о протеомах Arthrobacter sp. A3 и Escherichia coli (K12) | |||
Parameter | Arthrobacter sp. A3 | Escherichia coli (K12) | |
Proteome ID | UP000055883 | UP000000625 | |
The number of proteins | 3809 | 4306 | |
Residues | 1247079 | 1356195 |
Для сравнения этих бактерий было проанализировано процентное содержание аминокислотных остатков в протеомах с помощью программы Excel из пакета Ms Office, в частности, таких функций, как СУММ, ОКРУГЛ и ВПР. Чтобы подсчитать процентное содержание одной аминокислоты от общего числа аминокислотных остаков, было подсчитано общее число остатков, а затем число остатков одной из аминокислот поделено на рассчитанную величину, умножено на 100% и округлено до третьего знака. Число аминокисотных остатков в скачанном протеоме было подсчитано с помощью программы wordcount. В Таблице 2 представлены результаты этих вычислений, причем в первой колонке стоит однобуквенный код аминокислоты, во второй - её процентное содержание в протеоме Arthrobacter sp. A3 от общего числа аминокислот (величины располагаются по убыванию), в третьей - процентное содержание аминокислоты в протеоме Escherichia coli (K12) (величины сопоставлены относительно второй колонки, не ранжированы), в четвертой - разность между этими величинами, выраженная в процентах. Можно заметить, что в четвертой колонке присутствуют отрицательные величины, это можно объяснить тем, что вычисление производилось относительно протеома Arthrobacter sp. A3. При подсчете аминокислотных остатков в протеоме Escherichia coli (K12) были обнаружены 3 остака солецистеина (U), которые не представлены в Таблице 2 и не учитывались при вычислении процентного содержания остатков.
Таблица 2. Сравнение аминокислотного состава протеомов Arthrobacter sp. A3 и Escherichia coli (K12) | |||
Residue | Arthrobacter sp. A3, % | Escherichia coli (K12), % | Δ, % |
A | 12,836 | 9,514 | 3,322 |
L | 10,269 | 10,672 | -0,403 |
G | 8,777 | 7,375 | 1,402 |
V | 8,380 | 7,073 | 1,402 |
S | 6,220 | 5,802 | 0,418 |
T | 6,182 | 5,399 | 0,783 |
R | 5,716 | 5,511 | 0,205 |
E | 5,463 | 5,762 | -0,299 |
D | 5,395 | 5,151 | 0,244 |
P | 5,166 | 4,426 | 0,740 |
I | 4,778 | 6,010 | -1,232 |
F | 3,365 | 3,891 | -0,526 |
Q | 3,173 | 4,440 | -1,267 |
K | 3,040 | 4,406 | -1,366 |
N | 2,826 | 3,945 | -1,119 |
M | 2,229 | 2,820 | -0,591 |
Y | 2,086 | 2,845 | -0,759 |
H | 2,060 | 2,267 | -0,207 |
W | 1,457 | 1,531 | -0,074 |
C | 0,582 | 1,158 | -0,576 |
На основании данных, приведённых в Таблице 2, можно сделать следующие выводы:
Первые три наиболее часто встречающиеся аминокислотные остатки совпадают у бактерий Arthrobacter sp. A3 и Escherichia coli (K12), лишь с тем различием, что наибольшим, по числу остатков в протеоме, у Arthrobacter sp. A3 является аланин (A), его сило составляет 12,836%, а у Escherichia coli (K12) таковым является лейцин (L) - 10,672%. На втором месте у Arthrobacter sp. A3 - лейцин (L) - 10,269%, а у Escherichia coli (K12) - 9,514%. Третье место по числу остатков в протеоме занимает глицин (G) у обоих организмов.
В большей степени совпадают наиболее малочисленные аминоксилотные остатки. Так и у Arthrobacter sp. A3, и у Escherichia coli (K12) 18, 19 и 20 места приходятся на гистидин (H), триптофан (W) и цистеин (C).
В большинстве случаев падение величин процентного содержания аминокислотных остатков у Arthrobacter sp. A3 совпадает с таковым у Escherichia coli (K12), однако в некоторых случаях существуют различия, которые очень хорошо видны из результатов нахождения разности между величинами, стоящими во второй и в третьей колонках. Так, начиная с изолейцина (I), разница есть величина отрицательная, наибольшее значение которой приходится на лизин (K), у которого она составляет 1,366%, а наименьшее - на триптофан (W) - 0,074%. То есть этих остаков больше у Escherichia coli (K12).
Если же посмотреть на положительные значения разности, то можно заметить, что наибольшее их значение соответствует аланину (A) - 3,322%, который является, как уже было отмечено выше, самым многочисленным остатком во всем протеоме. А наименьшее - аргинину (R) - 0,205%.
Таким образом, разница самая большая в пользу Escherichia coli (K12) для лизина (K), а для аланина (A) - самая большая разница в пользу Arthrobacter sp. A3.
В результате данного анализа можно заключить, что в большинстве случаев несмотря на то, что рассматриваемые бактерии не являются родственными организмами, процентное содержание у них аминокислотных остатков относительно всего протеома совпадает, причем для некоторых остатков эта разница составляет менее 1%. Такие данные позволяют предположить, что аминокислотный состав анализируемых протеомов отличается незначительно.
Для подсчета аминокислотных остатков в протеоме можно использовать программу compseq. Ниже В Таблице 3 приведена сравнительная характеристика программ wordcount и compseq.
Таблица 3. Сравнение программ wordcount и compseq | |||
Параметр | wordcount | compseq | |
Наличие названий белков, составляющих протеом | Нет | Есть | |
Подсчёт общего числа аминокислотных остатков | Нет | Есть | |
Подсчёт числа аминокислотных остатков в протеоме | Есть | Есть | |
Вывод числа аминокислотных остатков | По убыванию | По алфавиту | |
Подсчёт наблюдаемой частоты встречаемости | Нет | Есть | |
Подсчёт ожидаемой частоты встречаемости (если считать случайным исходное множество) | Нет | Есть | |
Подсчёт отношения наблюдаемой частоты встречаемости к ожидаемой | Нет | Есть | |
Вывод числа символов, не обозначенны, как аминокислотные остатки | Нет | Есть |
По данным, приведённым в Таблице 3, можно заключить, что программа compseq является более информативной и для проведённой работы использование её было бы более полезным, так как в в случае её применения отпала бы необходимость использования Excel для подсчета процентного соотношения аминокислотных остатков в протеоме и проведения других вычислений.
[1] Ссылка на сайт Uniprot [2] "МР 4.2.0020-11. 4.2. Методы контроля. Биологические и микробиологические факторы. Фенотипическая идентификация бактерий рода Corynebacterium. Методические рекомендации", М., Федеральный центр гигиены и эпидемиологии Роспотребнадзора, 2011. |