Аржаева Елена Викторовна Московский государственный университет имени М.В.Ломоносова, факультет биоинженерии и биоинформатики, город Москва
Бактерия, о которой пойдет речь в данном мини-обзоре, называется Leptospira borgpetersenii serovar Ceylonica. Она вызывает инфекционное заболевание — лептоспироз, являющееся одним из наиболее широко распространенных зоонозных заболеваний в мире {5}. Его резервуаром для передачи человеку являются крысы {4}.
Суперцарство: | Bacteria |
---|---|
Тип: | Spirochaetota |
Класс: | Spirochaetia |
Отряд: | Leptospirales |
Семейство: | Leptospiraceae |
Род: | Leptospira |
Вид: | Leptospira borgpetersenii |
Как было сказано выше, исследуемый организм относится к роду Leptospira. Представители данной систематической группы – это грамотрицательные бактерии в форме штопора, около 0,1 мкм в диаметре и 6-20 мкм в длину. Микроорганизмы являются аэробами, не устойчивы к засухе {2}.
Данные о нуклеотидной и аминокислотной последовательности были получены с сайта Национального Центра Биотехнологической информации (NCBI). Гистограммы распределения длин белков [2] и распределения GC% состава [3] были построены с помощью Google Sheets. Для анализа встречаемости старт кодонов использовался язык программирования Bash и Google Sheets [4]. С помощью языка программирования Python 3 были проанализированы аминокислотные последовательности бактерии [1].
На основе CDS бактерии были найдены длины (в аминокислотах) всех продуктов трансляции у данного вида. Затем построена гистограмма, которая отражает соответствие количества белков каждому интервалу возможной длины.Таким образом, на рис.1 можно заметить, что большинство белков имеет длину от 99 до 379 аминокислот. Количество более длинных пептидов сильно меньше.
Была построена гистограмма, иллюстрирующая количество CDS с каждым интервалом процентного содержания нуклеотидов G и C.
Согласно рис.2 продукты трансляции имеют в среднем от 36 до 46 % G и C нуклеотидов в кодирующей нуклеотидной последовательности.
В результате данной части исследования было найдено количество каждого из 64 возможных старт кодонов, которое встречается во всех кодирующих последовательностях. Затем было учтено, что существуют псевдогены. В результате была получена таблица, иллюстрирующая количество каждого старт кодона в “нормальных” кодирующих последовательностях.
Codons | All_CDS | Pseudo CDS | Normal CDS |
---|---|---|---|
ATG | 2738 | 112 | 2626 |
TTG | 387 | 11 | 376 |
GTG | 202 | 7 | 195 |
ATT | 25 | 10 | 15 |
ATC | 19 | 9 | 10 |
ATA | 16 | 7 | 9 |
CTG | 10 | 1 | 9 |
остальные | 52 | 52 | 0 |
Исходя из таблицы 1, в “нормальных” кодирующих последовательностях наиболее часто встречается старт кодон – ATG, вторым по распространенности является кодон TTG.
С помощью языка программирования Python были проанализированы аминокислотные последовательности белков данной бактерии [1], в таблице 2 представлены частоты встречаемости аминокислот, по категориям {3}.
Категории | Примеры аминокислот | Частота, % |
---|---|---|
гидрофобные, незаряженные | глицин, аланин, пролин, валин, метионин, лейцин, изолейцин | 42,14 |
гидрофильные, положительно заряженные | лизин, гистидин и аргинин | 14,10 |
гидрофильные, отрицательно заряженные | аспарагиновая и глутаминовая кислоты | 12,00 |
полярные, незаряженные | серин, треонин, цистеин, аспарагин, глутамин | 21,43 |
ароматические | фенилаланин, тирозин, триптофан | 10,33 |
Также с помощью языка программирования Python [1] получены данные: чаще всего в аминокислотной последовательности белков Leptospira borgpetersenii serovar Ceylonica встречается аминокислота L ( лейцин ) – 107735 раз; от общего числа встречаемости аминокислот это составляет 10,37%. Напротив, реже всего встречается аминокислота C ( цистеин ) – 8728 раз; от общего числа встречаемости аминокислот это составляет 0,84%
[1] Программный код на языке Python 3 для анализа аминокислотного состава: Ссылка на код
[2] Таблица Google Sheets для построения гистограммы длин белков: Ссылка на таблицу
[3] Таблица Google Sheets распределение GC% состава: Ссылка на таблицу
[4] Таблица Google Sheets с информацией о старт кодонах: Ссылка на таблицу
Я выражаю благодарность Аржаевой Татьяне Михайловне за поддержку, также Изгагину Михаилу Александровичу, Нагорному Даниилу Васильевичу за советы в написании мини-обзора.
{1} Таксономия бактерии: https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?name=Leptospira+borgpetersenii
{2} Mohammed H. et al. Лептоспира: морфология, классификация и патогенез//J Bacteriol Parasitol. – 2011. – Т. 2. – №. 06.
{3} Ленинджер А. Основы биохимии: в 3-х т. Т. 1. – 1985, глава 3
{4} Inada, R., Ido, Y., Hoki, R., Kakeno, R. & Ito, H. Этиология, способ заражения и специфическая терапия болезни Вейля ( Spirochaetosis icterohaemorrhagica ). J. Exp. Med. 23 , 377–403 (1916).
{5} Haake D. A., Levett P. N. Лептоспироз человека //Лептоспира и лептоспироз. – 2015. – С. 65-97.