Обзор бактерии Helicobacter himalayensis

фото бактерии
Рисунок 1. Фотографии бактерии Helicobacter himalayensis, полученные с помощью проникающей электронной микроскопии[1].

АННОТАЦИЯ

Данная работа посвящена вопросам состава генома бактерии Helicobacter himalayensis и освещает главные характеристики протеома бактерии(соотношение длин белков,количественное соотношение тРНК) используя в качестве источника хромосомную таблицу данного организма.

ВВЕДЕНИЕ

Бактерии рода Helicobacter - грамотрицательные спиралевидные микроаэрофильные бактерии, обитающие в пищеварительной системе животных. Рассматриваемая бактерия, Helicobacter himalayensis, была обнаружена в слизистой оболочке желудка Marmota himalayana, гималайского сурка. Впервые штамм данной бактерии был выделен в 2015 году. Авторы статьи[1] отметили, что данная бактерия похожа по своим генетическим параметрам на Helicobacter Marmota, но требует других условий инкубирования, а именно повышенной температуры. Авторы предполагают, что отек желудка и воспаление слизистой оболочки у исследуемых сурков могут быть вызваны именно этой бактерией. В этом случае, такая патогенная активность является типичной для представителей рода Helicobacter. Гималайские сурки являются естественным резервуаром чумы в Юго-Восточной Азии, поэтому изучение их жизненного цикла и, в частности, их заболеваний, является актуальной задачей.

МАТЕРИАЛЫ И МЕТОДЫ

В процессе работы использовались возможности программы Microsoft Excel, а также Google Sheet, такие как:
● Создание плоской таблицы с помощью функции VLOOKUP
● Замена значений цепей из исходной таблицы(+/- ) на более удобные для дальнейшей работы(1/- 1) с помощью функции IF
● Фильтр с использованием масок для поиска различных типов белков и кодирующих последовательностей
● Сортировка строк по длине гена
● Создание графиков и диаграмм по данным, полученным из таблицы
● Функция BINOM.DIST, позволяющая рассчитать случайность распределения генов по цепям хромосомы бактерии.
● Различные способы форматирования таблиц для придания более понятного и удобного вида: заморозка верхней строки, настройка длины и ширины столбцов.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Результаты статистических исследований и общая информация о геноме бактерии будут представлены ниже. Все выкладки представлены в сопроводительной хромосомной таблице.
Общая информация:
Объём генома - 1829842 пар оснований, что приблизительно равно 1830 килобазам и входит в рамки обычной длины генома бактерии[2].
Количество генов – 1752, из которых 1661 ген кодирует белок. Полное распределение можно увидеть на таблице 1.
● Найдено достаточно большое количество генов, кодирующих гипотетические белки, то есть белки, существование которых доказано, но нет данных о их функциях в живом организме. Их количество равно 582, что составляет 33,2% от общего числа генов и 35% от кодирующих белок последовательностей. Подобное явление может быть связано с малой изученностью бактерии, и, соответственно, малым количеством опытов с её участием.
● В геноме находится 44 псевдогена, они составляют 2.64% от общего количества кодирующих белки генов.
● В геноме бактерии располагается 61 рибосомный белок, а также 47 генов, кодирующих различные РНК. Названия рибосомных белков можно увидеть в сопроводительной таблице.Примечательно, что для абсолютно всех рибосомных белков есть единственный ген, который их кодирует.
гистограмма
Таблица 1. Распределение генов в геноме бактерии.


Гистограмма длин белков
Гистограмма длин белков представлена на рисунке 2. Из гистограммы видно, что белки в большинстве своем короткие(почти все белки имеют длину меньше 1000 аминокислотных остатков). Также можно заметить классическую “двугорбую” структуру гистограммы - 1-ый горб находится в кармане “100- 150”, второй же находится на интервале “250-300”. Наиболее часто встречающаяся длина белков - от 200 до 300 аминокислотных остатков.
Также можно посмотреть на гистограмму с другим шагом, а именно 40 аминокислотных остатков(рис.3) На этой гистограмме два бугра прослеживаются более отчетливо.
гистограмма2
Рисунок 2. Гистограмма длин белков с шагом 50. По оси Х отложены интервалы длин белков, по оси Y - количество белков, попадающих в этот интервал
гистограмма3
Рисунок 3 Гистограмма длин белков с шагом 40.


Случайность распределения генов по цепям
Вероятность того, что из 1752 генов на одной цепочке случайным образом оказалось 847 генов, оказалась равна 0.173 при доверительном интервале p = 0.05, поэтому наблюдаемое распределение генов не противоречит гипотезе о независимом случайном распределении генов по цепочкам.

Статистика по тРНК
На рисунке 4 представлена статистика по количеству генов, кодирующих те или иные тРНК. Большое количество генов, синтезирующих ту или иную тРНК, может быть связано с повышенным задействованием соответствующей аминокислоты в строительстве белков.
распределение тРНК

Рисунок 4 Статистика по количеству генов, кодирующих различные тРНК


Гистограмма межгенных промежутков
Гистограммы межгенных промежутков представлены на рисунках 5 и 6 ( для “+”-цепи и “-”-цепи соответственно).
гистограмма4
Рисунок 5. Гистограмма межгенных промежутков на “+”-цепи.
гистограмма5
Рисунок 6 Гистограмма межгенных промежутков на "-"-цепи



Можно заметить, что длина межгенных промежутков весьма сильно варьируется и не имеет какого-то значения, в которое бы включалось большинство длин. Также на гистограмме были обнаружены отрицательные межгенные промежутки - это значит, что некоторые гены бактерии накладываются друг на друга. Вероятно, таким образом достигается экономия места в геноме, как у некоторых вирусов.

ЗАКЛЮЧЕНИЕ

В ходе обзора бактерии Helicobacter himalayensis было выяснено, что это условно патогенный микроорганизм с белками средней длины, у которого наблюдается случайное распределение генов по цепям и есть перекрестная транскрипция генов, Можно сказать, что данная бактерия представляет особый интерес для жителей Юго-Восточной Азии, т.к. с её помощью можно в теории регулировать численность гималайских сурков, которые, как уже было написано во введении, являются резервуарами чумы. К сожалению, бактерию выделили в отдельный вид совсем недавно, поэтому много информации о ней найти не удалось. Это видно по хромосомной таблице и выражается в большом числе гипотетических белков.

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

Хромосомная таблица Helicobacter himalayensis:
http://bit.ly/chr_table

ССЫЛКИ

[1] - Hu, S., Xu, J., Zhang, J., Lu, S., Huang, Y., Du, X., … Xiong, Y. (2015). Helicobacter himalayensis sp. nov. isolated from gastric mucosa of Marmota himalayana. International Journal of Systematic and Evolutionary Microbiology. International journal of systematic and evolutionary microbiology, Volume 55, Issue 6.
[2] - Н.В. Равин, С.В. Шестаков. ГЕНОМ ПРОКАРИОТ. Вавиловский журнал генетики и селекции, 2013, Том 17, № 4/2.
[3] NCBI(электронный ресурс): https://www.ncbi.nlm.nih.gov/genome/44274