Мини-обзор генома и протеома бактерии Streptomyces subrutilus


ШМАРИОН ЕГОР МАКСИМОВИЧ

Факультет биоинженерии и биоинформатики, МГУ им. М. В. Ломоносова,
Ленинские Горы, 1 строение 73, Москва, 119192, Россия
egorshmarion@mail.ru


Ключевые слова: геном Streptomyces subrutilus; протеом Streptomyces subrutilus.

Введение
Streptomyces subrutilus является грамположительной аэробной бактерией. Она относится к классу Actinobacteria. Это мезофильная бактерия, которая способна вырабатывать антибиотические соединения, такие как дезоксиноиримицин, дезоксиманноиримицин и гидроксистрептомицин [1], [2]. Оптимальной температурой для культивации этой бактерии является 26 градусов по Цельсию. Streptomyces subrutilus обладает 1 уровнем биобезопасности, что говорит о том, что эта бактерия является хорошо изученной и не вызывает заболевания у здоровых людей [3].

Материалы и методы
В ходе анализа генома бактерии [4] применялись следующие методы работы с электронными таблицами:

Результаты и обсуждение
В ходе работы была проверена и подтверждена правомерность применения второго правила Чаргаффа к геному Streptomyces subrutilus. Проверка была произведена через подсчёт относительных различий в количествах нуклеотидов A-T и C-G в одной цепочке ДНК. Они были подсчитаны по формуле: D = M/S * 100%, где D - относительная разница количеств нуклеотидов в одной цепочке ДНК, M - модуль разницы количеств нуклеотидов, S - полусумма количеств нуклеотидов. Полученные значения для пар A-T и C-G составили 0.56% и 0.5% соответственно. Также выяснена точная длина генома бактерии, который представлен одной кольцевой хромосомой (информация получена из общих сведений о бактерии). Результаты представлены в таблице 1. В процессе этой проверки было выяснено, что в геноме бактерии присутствуют только нуклеотиды ACGT и не содержится никаких других нуклеотидов - это показано анализом содержимого файла с геномом бактерии, результаты которого также отражает таблица 1.

Таблица 1.Проверка второго правила Чаргаффа для Streptomyces subrutilus
Всего символов в файле с геномом 7 700 037
Количество аденинов(A) в одной цепочке ДНК 1 012 473
Количество цитозинов(С) в одной цепочке ДНК 2 785 903
Количество гуанинов(G) в одной цепочке ДНК 2 799 781
Количество тиминов(T) в одной цепочке ДНК 1 006 817
Количество знаков переноса строки в файле с геномом 95 063
Общая длина одной цепочки ДНК Streptomyces subrutilus 7 604 974
Относительная разница в количествах A и T в одной цепочке 0.56%
Относительная разница в количествах С и G в одной цепочке 0.50%


Проведён анализ встречаемости генов разных типов в геноме Streptomyces subrutilus. Он был выполнен при помощи сводных таблиц в программе Excel на основе данных о геноме бактерии. Его результаты представлены в таблице 2.

Таблица 2.Встречаемость генов
Тип гена Количество генов
protein_coding 6 438
pseudogene 217
RNase_P_RNA 1
rRNA 21
SRP_RNA 1
tmRNA 1
tRNA 68
Всего генов 6747


Из таблицы 2 следует, что типы генов, кодирующие tmRNA, SRP_RNA и RNase_P_RNA, представлены всего одним соответствующим им участком генома и имеют на одни или несколько порядков меньшую встречаемость в геноме по сравнению с другими типами генов. Эти РНК уже известные, но свойства у них, как мне показалось, не самые обычные: tmRNA - "высвобождает" рибосому, которую "заклинило" на матричной РНК[5]; RNase_P_RNA - выполняет функцию РНКазы для транспортной РНК[6]; SRP_RNA - составная часть комплекса распознавания сигнала(может перенаправить синтез белка из внутренности клетки во внешнюю среду)[7]. На основе этого можно предположить, что они могут являться важным для жизни бактерии. Эта гипотеза требует проведения дополнительных исследований в данном направлении. Протеом этой бактерии содержит 13141 белок. Самый длинный из них состоит из 5209 аминокислот, а самый короткий из 24 аминокислот (эта информация получена из базы данных белков UniProt). Проанализированы длины белков, которые может синтезировать бактерия без учёта разных вариантов посттрансляционных модификаций. Количество белков составило 6438 (см. таблица 2). Построена гистограмма длин белков, представленная на рисунке 1.

Рисунок 1. Гистограмма длин белков. Вертикальная ось - кол-во белков в диапазоне. Горизонтальная ось - диапазоны длин белков.

Минимальная и максимальная длина белков составляют 29 и 5209 аминокислотных остатков соответственно. Медианное значение равно 286. 95% длин белков лежит в диапазоне от 29 до 735 аминокислотных остатков, 99,5% - от 29 до 1536. Были дополнительно проанализированы наиболее длинные белки(более 1500), примерно ⅓ из них составили “белки, содержащие домен аденилирования аминокислот” (amino acid adenylation domain-containing protein). Всего в геноме бактерии содержится 25 белков из этой группы, в том числе самый длинный в геноме - 5209 аминокислотных остатков. Также длина самого короткого белка из этой группы составляет 515 аминокислотных остатков, что примерно в 1.8 раза превышает медианное значение (используем медиану, так как плотность распределения значений асимметрична). Из этого следует, что все белки из этой группы у бактерии имеют массу значительно больше её медианного значения массы белков. Это может свидетельствовать о необычных функциях, поэтому они требуют дополнительного изучения в отдельном исследовании.

Сопроводительные материалы:
Сопроводительные материалы представлены таблицей Excel, которая лежит на сервере кодомо
Листы:

Список литературы:
  1. Основные данные о Streptomyces subrutilus на сайте BacDive
  2. Статья на Википедии о бактерии Streptomyces
  3. Сайт компании ATCC, поставляющей биоматериалы. По ссылке можно увидеть краткое описание Streptomyces subrutilus (ссылка не является рекламой компании ATCC)
  4. Ссылка на данные о геноме и протеоме бактерии Streptomyces subrutilus
  5. Ссылка на статью Википедии о tmRNA
  6. Ссылка на статью Википедии о RNase_P_RNA https://en.wikipedia.org/wiki/Ribonuclease_P
  7. Ссылка на статью Википедии о SRP_RNA