Резюме: В данном мини-обзоре с помощью программ, написанных на языке Python, и электронных таблиц выявлены особенности генома и протеома бактерии Lysobacter antibioticus.
Ключевые слова: бактерия, геном, протеом, генетический код, кодоны.
Целью данного обзора является изучение генома и протеома Lysobacter antibioticus. Lysobacter antibioticus является важной бактерией биоконтроля против фитопатогенов в почве и обладает способностью продуцировать нелетучие антимикробные метаболиты [1]. Бактерия принадлежит к роду Lysobacter, который является одним из наиболее распространенных микроорганизмов окружающей среды. Некоторые бактериальные штаммы видов Lysobacter способны защищать растения от болезней. Представители Lysobacter antibioticus являются типичными обитателями почвы. Это грамотрицательные бактерии, обладающие антагонистическим действием против фитопатогенов и являющиеся потенциальными кандидатами в качестве биоконтроля против болезней сельскохозяйственных культур. Именно это и вызвало интерес к изучению данных микроорганизмов.
Например, L. antibioticus HS124 обладает способностью к биоконтролю для производства 4-гидроксифенилуксусной кислоты и нескольких литических ферментов против фитофтороза [2]. Lysobacter antibioticus продуцирует миксин, который блокирует синтез ДНК патогенов, а L. antibioticus 13-1 является потенциальным средством биоконтроля бактериальной гнили риса.
С источника [3] были скачаны 3 файла: таблица локальных особенностей, геном и кодирующие последовательности. Частота использования трех стоп-кодонов в кодирующих последовательностях белков вычислена с помощью программы Stop_codons [4], написанной на языке Python. С помощью программы GC-skew и программы GC [5] был получен GC-состав в геноме изучаемой бактерии. В электронной таблице GoogleSheet [6] построена гистограмма Cumulative GC-skew, определены точки минимума (соответствует ориджину репликации) и максимума (соответствует месту конца репликации хромосомы). Программой Leucine_codons [7] были найдены частоты кодонов, кодирующих аминокислоту лейцин. В электронной таблице GoogleSheet [8] (лист “Histogram”) построена гистограмма длин белков. В электронной таблице GoogleSheet [9] (лист “Распределение генов по цепям ДНК”) посчитано распределение генов по цепям ДНК.
В стандартном генетическом коде существуют три стоп-кодона: TAG, TAA, TGA. Частота использования стоп-кодонов отличается для разных видов бактерий. Частота использования трех стоп-кодонов для Lysobacter antibioticus представлена в таблице 1.
Наиболее часто в геноме Lysobacter antibioticus встречается стоп-кодон TGA. Наименьшая частота - TAG. Распределение стоп-кодонов в геноме организма неслучайно и может коррелировать с GC-содержанием. Крупномасштабное исследование бактерий с широким диапазоном содержания GC показывает, что, хотя частота появления TAA отрицательно коррелирует с содержанием GC, а частота появления TGA положительно коррелирует с содержанием GC, частота встречаемости стоп-кодона TAG, который часто является минимально используемым стоп-кодоном в геноме, не зависит от содержания GC. Доля GC в геноме Lysobacter antibioticus - 0,6682 - такой высокий показатель доказывает, что стоп-кодон TGA будет самым распространенным в геноме изучаемой бактерии, TAA будет вторым по встречаемости, a TAG (который не зависит от доли GC) будет самым редким, что и видно в таблице 1.
Частота кодонов, кодирующих лейцин, представлена в таблице 2.
Лейцин кодируется шестью кодонами. В разных организмах выбор частых и редких синонимичных кодонов различен. В то же время этот выбор более или менее постоянен в разных генах одного генома. По мере накопления доступных для анализа нуклеотидных последовательностей из разных организмов становилось понятно, что неравное распределение синонимичных кодонов находится под действием эволюционных сил (естественный отбор, дрейф генов, мутации) и может проявляться по-разному в разных участках генов, геномов и в разных организмах. Вследствие вырожденности генетического кода часть аминокислот закодирована несколькими кодонами. Кодоны, кодирующие одну аминокислоту, называют синонимичными, или изоакцепторными. Для 18 аминокислот существует более одного кодона (от 2 до 6). Для восьми аминокислот третья позиция их кодонов является вырожденной — там может встречаться любой из четырёх возможных нуклеотидов. Длительное время считалось, что изоакцепторные кодоны равноправны, поскольку последовательность кодируемого белка не меняется, и мутации, превращающие один изоакцепторный кодон в другой (например, мутации по третьему положению четырёхкратно вырожденных кодонов), являются нейтральными («молчащими»). Однако с появлением в открытом доступе нуклеотидных последовательностей различных генов стали накапливаться свидетельства неравного распределения синонимичных кодонов в кодирующей ДНК. В англоязычной литературе это явление получило название Codon usage bias. Согласно таблице 2 чаще всего в геноме Lysobacter ,antibioticus встречается CTG, а реже всего TTA.
Минимум GC-skew составил 0,007 у Lysobacter antibioticus, что соответствует ориджину репликации, а максимум - 62,019 - место, где заканчивается репликация. График Cumulative GC-skew [6] представлен на рисунке 1.
Гистограмма длин белков [8] представлена на рисунке 2.
По гистограмме видно, что больше всего белков состоят из ~400 аминокислот. Самым длинным оказался - autotransporter-associated beta strand repeat-containing protein - 4949 аминокислот.
Выявлено распределение генов на прямой и обратной цепи ДНК. Результаты представлены в таблице 3. Из данной таблицы можно сделать вывод, что гены, кодирующие белки, распределены равномерно на прямой и обратной цепи, в то время как тРНК и рРНК распределены неравномерно (отличие в несколько раз).
Благодарю Мурашка Веронику Васильевну за предоставленные программы, написанные на языке Python, для обзора генома и протеома Lysobacter antibioticus.