Мини-обзор бактерии Leptospira borgpetersenii serovar Ceylonica, её генома и протеома


Аржаева Елена Викторовна Московский государственный университет имени М.В.Ломоносова, факультет биоинженерии и биоинформатики, город Москва

1 ВВЕДЕНИЕ


Бактерия, о которой пойдет речь в данном мини-обзоре, называется Leptospira borgpetersenii serovar Ceylonica. Она вызывает инфекционное заболевание — лептоспироз, являющееся одним из наиболее широко распространенных зоонозных заболеваний в мире {5}. Его резервуаром для передачи человеку являются крысы {4}.


Таксономическое положение Leptospira borgpetersenii serovar Ceylonica {1}:
Суперцарство: Bacteria
Тип: Spirochaetota
Класс: Spirochaetia
Отряд: Leptospirales
Семейство: Leptospiraceae
Род: Leptospira
Вид: Leptospira borgpetersenii

Как было сказано выше, исследуемый организм относится к роду Leptospira. Представители данной систематической группы – это грамотрицательные бактерии в форме штопора, около 0,1 мкм в диаметре и 6-20 мкм в длину. Микроорганизмы являются аэробами, не устойчивы к засухе {2}.


2 МАТЕРИАЛЫ И МЕТОДЫ


Данные о нуклеотидной и аминокислотной последовательности были получены с сайта Национального Центра Биотехнологической информации (NCBI). Гистограммы распределения длин белков [2] и распределения GC% состава [3] были построены с помощью Google Sheets. Для анализа встречаемости старт кодонов использовался язык программирования Bash и Google Sheets [4]. С помощью языка программирования Python 3 были проанализированы аминокислотные последовательности бактерии [1].


3 РЕЗУЛЬТАТЫ


3.1 Распределение длин белков бактерии Leptospira borgpetersenii serovar Ceylonica:


Гистограмма длин белков
Рисунок 1. Гистограмма длин белков

На основе CDS бактерии были найдены длины (в аминокислотах) всех продуктов трансляции у данного вида. Затем построена гистограмма, которая отражает соответствие количества белков каждому интервалу возможной длины.Таким образом, на рис.1 можно заметить, что большинство белков имеет длину от 99 до 379 аминокислот. Количество более длинных пептидов сильно меньше.


3.2 Распределение GC% состава генов бактерии Leptospira borgpetersenii serovar Ceylonica:


Была построена гистограмма, иллюстрирующая количество CDS с каждым интервалом процентного содержания нуклеотидов G и C.


Гистограмма GC% состава
Рисунок 2. Гистограмма GC% состава

Согласно рис.2 продукты трансляции имеют в среднем от 36 до 46 % G и C нуклеотидов в кодирующей нуклеотидной последовательности.


3.3 Старт кодоны в геноме Leptospira borgpetersenii serovar Ceylonica


В результате данной части исследования было найдено количество каждого из 64 возможных старт кодонов, которое встречается во всех кодирующих последовательностях. Затем было учтено, что существуют псевдогены. В результате была получена таблица, иллюстрирующая количество каждого старт кодона в “нормальных” кодирующих последовательностях.


Таблица 1. Частоты встречаемости старт кодонов в геноме Leptospira borgpetersenii serovar Ceylonica

Codons All_CDS Pseudo CDS Normal CDS
ATG 2738 112 2626
TTG 387 11 376
GTG 202 7 195
ATT 25 10 15
ATC 19 9 10
ATA 16 7 9
CTG 10 1 9
остальные 52 52 0

Исходя из таблицы 1, в “нормальных” кодирующих последовательностях наиболее часто встречается старт кодон – ATG, вторым по распространенности является кодон TTG.


3.4 Анализ аминокислотного состава белков Leptospira borgpetersenii serovar Ceylonica


С помощью языка программирования Python были проанализированы аминокислотные последовательности белков данной бактерии [1], в таблице 2 представлены частоты встречаемости аминокислот, по категориям {3}.


Таблица 2. Частоты встречаемости аминокислот в протеоме Leptospira borgpetersenii serovar Ceylonica, по категориям

Категории Примеры аминокислот Частота, %
гидрофобные, незаряженные глицин, аланин, пролин, валин, метионин, лейцин, изолейцин 42,14
гидрофильные, положительно заряженные лизин, гистидин и аргинин 14,10
гидрофильные, отрицательно заряженные аспарагиновая и глутаминовая кислоты 12,00
полярные, незаряженные серин, треонин, цистеин, аспарагин, глутамин 21,43
ароматические фенилаланин, тирозин, триптофан 10,33

Также с помощью языка программирования Python [1] получены данные: чаще всего в аминокислотной последовательности белков Leptospira borgpetersenii serovar Ceylonica встречается аминокислота L ( лейцин ) – 107735 раз; от общего числа встречаемости аминокислот это составляет 10,37%. Напротив, реже всего встречается аминокислота C ( цистеин ) – 8728 раз; от общего числа встречаемости аминокислот это составляет 0,84%


4 СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ


[1] Программный код на языке Python 3 для анализа аминокислотного состава: Ссылка на код

[2] Таблица Google Sheets для построения гистограммы длин белков: Ссылка на таблицу

[3] Таблица Google Sheets распределение GC% состава: Ссылка на таблицу

[4] Таблица Google Sheets с информацией о старт кодонах: Ссылка на таблицу

5 БЛАГОДАРНОСТИ


Я выражаю благодарность Аржаевой Татьяне Михайловне за поддержку, также Изгагину Михаилу Александровичу, Нагорному Даниилу Васильевичу за советы в написании мини-обзора.


6 ЛИТЕРАТУРА

{1} Таксономия бактерии: https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?name=Leptospira+borgpetersenii

{2} Mohammed H. et al. Лептоспира: морфология, классификация и патогенез//J Bacteriol Parasitol. – 2011. – Т. 2. – №. 06.

{3} Ленинджер А. Основы биохимии: в 3-х т. Т. 1. – 1985, глава 3

{4} Inada, R., Ido, Y., Hoki, R., Kakeno, R. & Ito, H. Этиология, способ заражения и специфическая терапия болезни Вейля ( Spirochaetosis icterohaemorrhagica ). J. Exp. Med. 23 , 377–403 (1916).

{5} Haake D. A., Levett P. N. Лептоспироз человека //Лептоспира и лептоспироз. – 2015. – С. 65-97.