Обзор протеома Frankia alni ACN14a

РЕЗЮМЕ

Целью данного обзора является получение общих сведений о протеоме бактерии Frankia alni ACN14a. С помощью возможностей электронных таблиц удалось получить информацию о длинах белков этого штамма, о гипотетических белках, рибосомальных белках, рРНК, тРНК и распределении генов по цепям ДНК.

ВВЕДЕНИЕ

Бактерии рода Frankia - азотфиксирующие актиномицеты, симбионты высших растений, образующие клубеньки в корнях. (Pujic et al., 2019). Frankia alni, рассматриваемая в данном обзоре, часто становится симбионтом ольхи (Alnus) (Ghedira et al., 2017). По словам Бенсона и Сильвестра, впервые штамм Frankia был выделен в 1978 году. Было показано, что данные бактерии обитают в почве, являясь факультативными симбионтами (Benson, Silvester, 1993). Последовательность генома этого штамма общедоступна (Normand et al., 2007). Данные, полученные в исследовании Кучо, основанном на транскрипционном анализе, помогли идентифицировать гены, которые могут быть связаны с возникновением симбиоза. Кроме того, было показано, что гены, участвующие в формировании клубеньков, находятся в участках генома с повышенной синтенией, а гены, подавляющие симбиоз, разбросаны по геному (Alloisio et al., 2010). Изучение протеома Frankia alni важно для понимания молекулярных механизмов развития симбиоза, а данное исследование поможет получить основную информацию о протеоме этой бактерии.

МАТЕРИАЛЫ И МЕТОДЫ

Для изучения протеома бактерии использовалась информация со страницы генома Frankia alni ACN14a сайта NCBI Genome (15.11.2019) и методы работы с электронными таблицами (Google sheets): импорт данных, создание плоской таблицы, специальная вставка, фильтр (поиск рибосомальных и гипотетических белков по названию), сортировка, построение диаграмм и функции:
ВПР - для создания плоской таблицы
СЧЕТЕСЛИ - для подсчета количеств генов на прямой и комплементарной цепи, гипотетических белков, белков, попадающих в определенный диапазон длины, генов тРНК
СЧЕТЕСЛИМН - для подсчета количеств белков, попадающих в определенный диапазон длины
СЧЕТЗ - для подсчета рибосомальных белков и РНК
ЕСЛИ, ПОИСК, ЕЧИСЛО - для поиска в названии белка слова “hypothetical”
МАКС - для определения белка с максимальной длиной
МИН - для определения белка с минимальной длиной
BINOM.DIST - для расчета вероятности данного расположения белков на цепях ДНК при случайном их распределении по цепям ДНК

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

Длины белков Frankia alni

Гистограмма длин белков
Рисунок 1. Гистограмма длин белков

Наибольшая длина белка в протеоме Frankia alni - длина гипотетического белка, состоящего из структурного мотива coiled-coil, NAD(P)-связывающей укладки Россмана и доменов альфа/бета-гидролаз - составляет 7085 остатков, наименьшая длина у семи 20-аминокислотных гипотетических белков. На гистограмме (рисунок 1) отчетливо выделяются два пика, что свидетельствует о присутствии в протеоме бактерии двух диапазонов, в которые попадают больше всего длин белков: 496 белков имеют длину от 60 до 80 и 328 белков - от 260 до 280 аминокислотных остатков. Среди белков, длины которых попадают в диапазон 60-80, встречаются сигнальные пептиды, транскрипционные факторы, рибосомальные белки, ферредоксины и белки холодового шока, однако подавляющее большинство белков гипотетические, поэтому точно установить причину появления большого количества белков с длиной в этом диапазоне невозможно, их функция неизвестна. В диапазоне 260-280 также много гипотетических белков, но для большинства известны предполагаемые функции: многие белки связаны с метаболизмом, присутствует большое количество мембранных белков, в том числе ABC-транспортеров. Эти данные содержатся в листе “Гистограмма длин белков” сопроводительных материалов.

Распределение генов по прямой и комплементарной цепочкам ДНК

Согласно результатам изучения протеома, представленным в листе “Распределение по прямой и комплементарной цепям” сопроводительных материалов, у Frankia alni ACN14a обнаружено 6786 генов, 3369 из которых находятся на прямой цепи ДНК, а 3417 - на комплементарной. Информация о количестве генов белков, тРНК, рРНК и РНК с неизвестной функцией представлена в таблице 1.

Таблица 1. Распределение генов по прямой и комплементарной цепям ДНК
Цепь ДНК Количество
Белки+3341
Белки-3382
тРНК+23
тРНК-23
рРНК+0
рРНК-6
misc*+5
misc*-6
*misc (miscellanous - разнообразный) - РНК с неизвестной функцией

Вероятность получения таких значений для всех генов, если они распределены по цепочкам ДНК случайно, составляет 28%. Для белков вероятность равна 31%, для тРНК - 56%, для рРНК - 2% и для РНК с неопределенной функцией - 50%. Скорее всего, белки, тРНК и РНК с неизвестной функцией распределены по цепям ДНК случайно, а на расположение рРНК, возможно, стоит обратить внимание.

Гипотетические белки

Анализ протеома Frankia alni ACN14a (лист “Гипотетические белки” сопроводительных материалов) показал, что 3328 белков в протеоме этой бактерии на данный момент являются гипотетическими. Это составляет 49,04% от всех генов, что свидетельствует о недостаточной изученности бактерии.

Рибосомальные белки и РНК

В таблице 2 отражены количества компонентов рибосом Frankia alni ACN14a: белков субъединицы 30S, белков субъединицы 50S, рибосомальных РНК. Их названия приведены в листе “Рибосомальные белки и РНК” в сопроводительных материалах.

Таблица 2. Рибосомальные белки и РНК
рРНКБелки 30SБелки 50S
Количество62943

Количество генов тРНК

Гистограмма количеств генов тРНК
Рисунок 2. Гистограмма количеств генов тРНК

Предполагается, что особенности образа жизни Frankia alni могут отражаться в ее геноме. В сопроводительных материалах (лист “Количество генов тРНК”) представлен анализ количества разных типов тРНК. Результаты анализа приведены в виде рисунка 2 и свидетальствют о том, что существенной разницы в количествах генов тРНК аминокислот, обычно участвующих в ассимиляции азота (Glu и Gln), и в количествах генов тРНК других аминокислот не было обнаружено. Возможно, различия в количествах генов тРНК не так важны для ассимиляции азота и регуляции этого процесса, но для решения этого вопроса требуется более подробное изучение данной бактерии.

ЗАКЛЮЧЕНИЕ

В данной работе представлены результаты исследования протеома Frankia alni ACN14a: гистограммы длин белков и количеств генов тРНК, сведения о гипотетических белках, рибосомальных белках и РНК, о распределении генов по цепям ДНК. Методы работы с электронными таблицами позволили получить информацию о распределении длин белков, количестве гипотетических белков, количестве тРНК разных типов, идентифицировать белки с наибольшей и наименьшей длиной, определить количество и названия рибосомальных белков и РНК, предположить, что расположение рРНК неслучайно, количество тРНК не связано с функциями аминокислот, не относящимися к синтезу белка. Данный обзор показал, что необходимо продолжать изучать протеом Frankia alni, поскольку функции многих белков неизвестны.

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

Таблица с результатами обзора

СПИСОК ЛИТЕРАТУРЫ


Alloisio N. et al. (2010). The Frankia alni Symbiotic Transcriptome. Mol Plant Microbe Interact. 23:593-607
David R. Benson, Warwick B. Silvester (1993). Biology of Frankia Strains, Actinomycete Symbionts of Actinorhizal Plants. Microbiological Reviews. 57:293-319
Ghedira K. et al. (2017). The PEG-responding desiccome of the alder microsymbiont Frankia alni. Sci Rep. 8:759
Normand, P. et al. (2007). Genome characteristics of facultatively symbiotic Frankia sp. strains reflect host range and host plant biogeography. Genome Res. 17:7-15.
Pujic P. et al (2019). Omics of the early molecular dialogue between Frankia alni and Alnus glutinosa and the cellulase synton. Environmental Microbiology. 21:3328–3345