В данной работе был проанализирован скачанный с сайта Uniprot протеом бактерии Arthrobacter sp. A3, один из белков которой был описан ранее.
Протеом - это набор белков, который экспрессируется данным организмом. Большинство протеомов Uniprot основаны на продуктах трансляции полного секвенированного генома и помимо хромосом включают последовательности, полученные от плазмид или из геномов органелл, которые встречаются в определенном организме. На данном сайте Вы можете найти протеомы, полученные как результат трансляции полностью отсеквенированного генома организма [1].

Arthrobacter sp. A3 относится к роду Arthrobacter, семейству Micrococcaceae, порядку Actinomycetales, классу Actinobacteria, типу Actinobacteria, царству Bacteria. На сегодняшний день, является представителем изолированной и неописанной популяции Arthrobacter, которая, по предварительным данным, выделяется в отдельный вид, название которому пока не было дано. Штаммы рода Arthrobacter широко распространены в окружающей среде (в частности в почве) и выделяются из клинического материала людей при бактериемии, различных инфекционных процессах [2].
С сайта Uniprot были скачаны протеомы организмов Arthrobacter sp. A3 и Escherichia coli (штамма K12), для того чтобы провести анализ частоты встречаемости аминокислотных остатков в двух протеомах. В Таблице 1 приведена общая информация о данных протеомах.


Таблица 1. Информация о протеомах Arthrobacter sp. A3 и Escherichia coli (K12)
Parameter Arthrobacter sp. A3 Escherichia coli (K12)
Proteome ID UP000055883 UP000000625
The number of proteins 3809 4306
Residues 1247079 1356195

Сравнение протеомов Arthrobacter sp. A3 и Escherichia coli (K12)

Для сравнения этих бактерий было проанализировано процентное содержание аминокислотных остатков в протеомах с помощью программы Excel из пакета Ms Office, в частности, таких функций, как СУММ, ОКРУГЛ и ВПР. Чтобы подсчитать процентное содержание одной аминокислоты от общего числа аминокислотных остаков, было подсчитано общее число остатков, а затем число остатков одной из аминокислот поделено на рассчитанную величину, умножено на 100% и округлено до третьего знака. Число аминокисотных остатков в скачанном протеоме было подсчитано с помощью программы wordcount. В Таблице 2 представлены результаты этих вычислений, причем в первой колонке стоит однобуквенный код аминокислоты, во второй - её процентное содержание в протеоме Arthrobacter sp. A3 от общего числа аминокислот (величины располагаются по убыванию), в третьей - процентное содержание аминокислоты в протеоме Escherichia coli (K12) (величины сопоставлены относительно второй колонки, не ранжированы), в четвертой - разность между этими величинами, выраженная в процентах. Можно заметить, что в четвертой колонке присутствуют отрицательные величины, это можно объяснить тем, что вычисление производилось относительно протеома Arthrobacter sp. A3. При подсчете аминокислотных остатков в протеоме Escherichia coli (K12) были обнаружены 3 остака солецистеина (U), которые не представлены в Таблице 2 и не учитывались при вычислении процентного содержания остатков.

Таблица 2. Сравнение аминокислотного состава протеомов Arthrobacter sp. A3 и Escherichia coli (K12)
Residue Arthrobacter sp. A3, % Escherichia coli (K12), % Δ, %
A 12,836 9,514 3,322
L 10,269 10,672 -0,403
G 8,777 7,375 1,402
V 8,380 7,073 1,402
S 6,220 5,802 0,418
T 6,182 5,399 0,783
R 5,716 5,511 0,205
E 5,463 5,762 -0,299
D 5,395 5,151 0,244
P 5,166 4,426 0,740
I 4,778 6,010 -1,232
F 3,365 3,891 -0,526
Q 3,173 4,440 -1,267
K 3,040 4,406 -1,366
N 2,826 3,945 -1,119
M 2,229 2,820 -0,591
Y 2,086 2,845 -0,759
H 2,060 2,267 -0,207
W 1,457 1,531 -0,074
C 0,582 1,158 -0,576

Анализ Tаблицы 2

На основании данных, приведённых в Таблице 2, можно сделать следующие выводы:

  1. Первые три наиболее часто встречающиеся аминокислотные остатки совпадают у бактерий Arthrobacter sp. A3 и Escherichia coli (K12), лишь с тем различием, что наибольшим, по числу остатков в протеоме, у Arthrobacter sp. A3 является аланин (A), его сило составляет 12,836%, а у Escherichia coli (K12) таковым является лейцин (L) - 10,672%. На втором месте у Arthrobacter sp. A3 - лейцин (L) - 10,269%, а у Escherichia coli (K12) - 9,514%. Третье место по числу остатков в протеоме занимает глицин (G) у обоих организмов.

  2. В большей степени совпадают наиболее малочисленные аминоксилотные остатки. Так и у Arthrobacter sp. A3, и у Escherichia coli (K12) 18, 19 и 20 места приходятся на гистидин (H), триптофан (W) и цистеин (C).

  3. В большинстве случаев падение величин процентного содержания аминокислотных остатков у Arthrobacter sp. A3 совпадает с таковым у Escherichia coli (K12), однако в некоторых случаях существуют различия, которые очень хорошо видны из результатов нахождения разности между величинами, стоящими во второй и в третьей колонках. Так, начиная с изолейцина (I), разница есть величина отрицательная, наибольшее значение которой приходится на лизин (K), у которого она составляет 1,366%, а наименьшее - на триптофан (W) - 0,074%. То есть этих остаков больше у Escherichia coli (K12).

  4. Если же посмотреть на положительные значения разности, то можно заметить, что наибольшее их значение соответствует аланину (A) - 3,322%, который является, как уже было отмечено выше, самым многочисленным остатком во всем протеоме. А наименьшее - аргинину (R) - 0,205%.

  5. Таким образом, разница самая большая в пользу Escherichia coli (K12) для лизина (K), а для аланина (A) - самая большая разница в пользу Arthrobacter sp. A3.

Вывод

В результате данного анализа можно заключить, что в большинстве случаев несмотря на то, что рассматриваемые бактерии не являются родственными организмами, процентное содержание у них аминокислотных остатков относительно всего протеома совпадает, причем для некоторых остатков эта разница составляет менее 1%. Такие данные позволяют предположить, что аминокислотный состав анализируемых протеомов отличается незначительно.

Сравнение программ wordcount и compseq

Для подсчета аминокислотных остатков в протеоме можно использовать программу compseq. Ниже В Таблице 3 приведена сравнительная характеристика программ wordcount и compseq.

Таблица 3. Сравнение программ wordcount и compseq
Параметр wordcount compseq
Наличие названий белков, составляющих протеом Нет Есть
Подсчёт общего числа аминокислотных остатков Нет Есть
Подсчёт числа аминокислотных остатков в протеоме Есть Есть
Вывод числа аминокислотных остатков По убыванию По алфавиту
Подсчёт наблюдаемой частоты встречаемости Нет Есть
Подсчёт ожидаемой частоты встречаемости (если считать случайным исходное множество) Нет Есть
Подсчёт отношения наблюдаемой частоты встречаемости к ожидаемой Нет Есть
Вывод числа символов, не обозначенны, как аминокислотные остатки Нет Есть

По данным, приведённым в Таблице 3, можно заключить, что программа compseq является более информативной и для проведённой работы использование её было бы более полезным, так как в в случае её применения отпала бы необходимость использования Excel для подсчета процентного соотношения аминокислотных остатков в протеоме и проведения других вычислений.

Источники:

[1] Ссылка на сайт Uniprot
[2] "МР 4.2.0020-11. 4.2. Методы контроля. Биологические и микробиологические факторы. Фенотипическая идентификация бактерий рода Corynebacterium. Методические рекомендации", М., Федеральный центр гигиены и эпидемиологии Роспотребнадзора, 2011.