ШМАРИОН ЕГОР МАКСИМОВИЧ
Факультет биоинженерии и биоинформатики, МГУ им. М. В. Ломоносова,
Ленинские Горы, 1 строение 73,
Москва, 119192, Россия
egorshmarion@mail.ru
Ключевые слова: геном Streptomyces subrutilus; протеом Streptomyces subrutilus.
Введение
Streptomyces subrutilus является грамположительной аэробной бактерией. Она относится к классу Actinobacteria. Это мезофильная бактерия, которая способна вырабатывать антибиотические соединения, такие как дезоксиноиримицин, дезоксиманноиримицин
и гидроксистрептомицин [1], [2].
Оптимальной температурой для культивации этой бактерии является 26 градусов по Цельсию. Streptomyces subrutilus обладает 1 уровнем биобезопасности, что говорит о том, что эта бактерия является хорошо изученной и не вызывает заболевания у
здоровых людей [3].
Материалы и методы
В ходе анализа генома бактерии [4] применялись следующие методы работы с электронными таблицами:
Всего символов в файле с геномом | 7 700 037 |
---|---|
Количество аденинов(A) в одной цепочке ДНК | 1 012 473 |
Количество цитозинов(С) в одной цепочке ДНК | 2 785 903 |
Количество гуанинов(G) в одной цепочке ДНК | 2 799 781 |
Количество тиминов(T) в одной цепочке ДНК | 1 006 817 |
Количество знаков переноса строки в файле с геномом | 95 063 |
Общая длина одной цепочки ДНК Streptomyces subrutilus | 7 604 974 |
Относительная разница в количествах A и T в одной цепочке | 0.56% |
Относительная разница в количествах С и G в одной цепочке | 0.50% |
Проведён анализ встречаемости генов разных типов в геноме Streptomyces subrutilus. Он был выполнен при помощи сводных таблиц в программе Excel на основе данных о геноме бактерии. Его результаты представлены в таблице 2.
Тип гена | Количество генов |
---|---|
protein_coding | 6 438 |
pseudogene | 217 |
RNase_P_RNA | 1 |
rRNA | 21 |
SRP_RNA | 1 |
tmRNA | 1 |
tRNA | 68 |
Всего генов | 6747 |
Из таблицы 2 следует, что типы генов, кодирующие tmRNA, SRP_RNA и RNase_P_RNA, представлены всего одним соответствующим им участком генома и имеют на одни или несколько порядков меньшую встречаемость в геноме по сравнению с другими типами
генов. Эти РНК уже известные, но свойства у них, как мне показалось, не самые обычные: tmRNA - "высвобождает" рибосому, которую "заклинило" на матричной РНК[5]; RNase_P_RNA - выполняет функцию РНКазы для транспортной РНК[6]; SRP_RNA - составная
часть комплекса распознавания сигнала(может перенаправить синтез белка из внутренности клетки во внешнюю среду)[7]. На основе этого можно предположить, что они могут являться важным для жизни бактерии. Эта гипотеза требует проведения
дополнительных исследований в данном направлении.
Протеом этой бактерии содержит 13141 белок. Самый длинный из них состоит из 5209 аминокислот, а самый короткий из 24 аминокислот (эта информация получена из базы данных белков UniProt). Проанализированы длины белков, которые может синтезировать
бактерия без учёта разных вариантов посттрансляционных модификаций. Количество белков составило 6438 (см. таблица 2). Построена гистограмма длин белков, представленная на рисунке 1.
Минимальная и максимальная длина белков составляют 29 и 5209 аминокислотных остатков соответственно. Медианное значение равно 286. 95% длин белков лежит в диапазоне от 29 до 735 аминокислотных остатков, 99,5% - от 29 до 1536. Были дополнительно
проанализированы наиболее длинные белки(более 1500), примерно ⅓ из них составили “белки, содержащие домен аденилирования аминокислот” (amino acid adenylation domain-containing protein). Всего в геноме бактерии содержится 25 белков из этой
группы, в том числе самый длинный в геноме - 5209 аминокислотных остатков. Также длина самого короткого белка из этой группы составляет 515 аминокислотных остатков, что примерно в 1.8 раза превышает медианное значение (используем медиану, так
как плотность распределения значений асимметрична). Из этого следует, что все белки из этой группы у бактерии имеют массу значительно больше её медианного значения массы белков. Это может свидетельствовать о необычных функциях, поэтому они
требуют дополнительного изучения в отдельном исследовании.
Сопроводительные материалы:
Сопроводительные материалы представлены таблицей Excel, которая лежит на сервере кодомо
Листы: