Объектом исследования стал геном грамположительной аэробной бактерии Streptomyces globosus. Бактерии рода Streptomyces являются каталазо-положительными, а также хемоорганогетеротрофами. Их форма является удлиненной и нитевидной. Они широко распространены в почве (примерно 80% от всех актиномицетов, найденных в почве). Бактерии рода Streptomyces активно применяются для создания антибиотиков: клавулановая кислота, хлорамфеникол, тетрациклин, стрептомицин и неомицин [3,4,5]
Бактерии Streptomyces как правило, не являются патогенными для человека. Однако в определенных условиях депрессия иммунной системы может привести к таким патологиям, как мицетомы, перитонит, хронический перикардит, септицемия, панникулит, шейный лимфаденит и эндокардит, среди других.
Бактерии могут попасть в организм через травмы или кожные раны. Оттуда это может перейти в кровоток и распространиться в различные органы. Если он не попадает в кровоток, он остается в слоях кожи, создавая поражения, из которых наиболее распространенными являются мицетомы [1, 2]
S. globosus - один из наименее изученных представителей рода Streptomyces, и геном и протеом этой бактерии нуждается в более детальном анализе. В этой работе был проведен анализ длин белков и распределение кодирующих последовательностей в репликонах по типу кодируемых ими продуктов у S. globosus.
Источником данных стала геномная таблица S. globosus из библиотеки NCBI. Ссылка на неё представлена в разделе “Сопроводительные материалы”.
Для построения гистограммы длин белков и гистограммы длин промежутков между CDS использовалась система “Гугл Таблицы”.
На основании данных их геномной таблицы бактерии была построена гистограмма, отражающая распределение белков S. globosus по их длине (в аминокислотных остатках). Полученная гистограмма приведена на Рисунке 2 ниже.
Из полученной гистограммы можно видеть, что большинство белков исследуемой бактерии имеет длину до 700 аминокислотных остатков. Наибольшее количество белков отмечается в диапазоне от 200 до 300 остатков (около 1500 белков), на втором месте по числу попавших в него белков диапазон 100-200 аминокислот, на третьем - 300-400 аминокислот. Также более 500 белков было найдено для диапазонов до 100 остатков и 400-500 остатков. Числа белков с длиной более 500 остатков не так велики, а длиной более 1600 остатков и вовсе обладают лишь единичные белки.
Такое распределение белков предсказуемо: большинство белков, такие как белки метаболизма, факторы адгезии, регуляторы активности генов, рибосомальные белки - это небольшие белки, а крупных белков у бактерий меньше, и это как правило большие ферментативные комплексы.
На основании данных их геномной таблицы бактерии был проведен анализ распредедения кодирующих последовательностей ДНК S. globosus по кодируемым ими продуктам - белкам (тогда соответствующая кодирующая последовательность называется CDS), транспортным РНК (tRNA), рибосомальным РНК (rRNA), транспортно-матричным РНК (tmRNA) и некодирующим РНК (ncRNA). Геном бактерии представлен кольцевыми хромосомами и плазмидами, и вначале было проанализировано распредедение кодирующих последовательностей на хромосомной ДНК. Результаты представлены на круговой диаграмме на Рисунке 3.
Из диаграммы видно, что большинство последовательностей (98,6%) - это белок-кодирующие последовательности, что довольно ожидаемо и характерно для бактериальных геномов. На последовательности, кодирующие тРНК, приходится лишь 1,1%, а на кодирующие другие РНК - и вовсе меньше 1 процента.
Для более детального рассмотрения вклада различных РНК в некодирующие последовательности была построена круговая диаграмма, представленная на рисунке 4.
Из данной диаграммы видно, что наибольшую долю среди некодирующих белки продуктов составляют тРНК (74,7% - почти 3 четверти), немногим менее одной четвертой всех РНК приходится на рРНК (22,1%), а количество некодирующих (2,1%) и транспортно-матричных РНК (1,1%, зеленая область на диаграмме) по сравнению с ними довольно мало. Данное распределение в целом отвечает общей тенденции для бактериальных геномов: преобладание тРНК, значительное количество рРНК (так как именно тРНК и рРНК принимают непосредственное участие в биосинтезе белков, который в бактериальных клетках идет активно), а некодирующие и транспортно-матричные РНК составляют значительно меньшую долю.
На плазмидной ДНК были найдены только белок-кодирующие последовательности, что в целом типично для роли плазмид в бактериальных геномах: обмениваясь плазмидами, бактерии. Другие виды кодирующих последовательностей на плазмидах встречаются очень редко, а у нашей бактерии они и вовсе не обнаружены.
Примечания к рабочей таблице:
На вкладке protein_cds представлены выбранные из полной геномной таблицы (вкладка feature_table) белок-кодирующие последовательности. Гистограмма длин белков строилась на вкладке protein_len-hist по данным вкладки protein_cds. Анализ распределения кодирующих последовательностей по репликонам проводился на основе feature_table, результаты представлены на вкладке per_replicones.
Источники 1-5 цитируются из обзорной статьи Streptomyces характеристики, таксономия, морфология, культура | Thpanorama