РЕЗЮМЕ
Целью данного обзора является получение общих сведений о протеоме бактерии Frankia alni ACN14a. С помощью возможностей электронных таблиц удалось получить информацию о длинах белков этого штамма, о гипотетических белках, рибосомальных белках, рРНК, тРНК и распределении генов по цепям ДНК.
ВВЕДЕНИЕ
Бактерии рода Frankia - азотфиксирующие актиномицеты, симбионты высших растений, образующие клубеньки в корнях. (Pujic et al., 2019). Frankia alni, рассматриваемая в данном обзоре, часто становится симбионтом ольхи (Alnus) (Ghedira et al., 2017). По словам Бенсона и Сильвестра, впервые штамм Frankia был выделен в 1978 году. Было показано, что данные бактерии обитают в почве, являясь факультативными симбионтами (Benson, Silvester, 1993). Последовательность генома этого штамма общедоступна (Normand et al., 2007). Данные, полученные в исследовании Кучо, основанном на транскрипционном анализе, помогли идентифицировать гены, которые могут быть связаны с возникновением симбиоза. Кроме того, было показано, что гены, участвующие в формировании клубеньков, находятся в участках генома с повышенной синтенией, а гены, подавляющие симбиоз, разбросаны по геному (Alloisio et al., 2010). Изучение протеома Frankia alni важно для понимания молекулярных механизмов развития симбиоза, а данное исследование поможет получить основную информацию о протеоме этой бактерии.
МАТЕРИАЛЫ И МЕТОДЫ
Для изучения протеома бактерии использовалась информация со страницы генома Frankia alni ACN14a сайта NCBI Genome (15.11.2019) и методы работы с электронными таблицами (Google sheets):
импорт данных, создание плоской таблицы, специальная вставка, фильтр (поиск рибосомальных и гипотетических
белков по названию), сортировка, построение диаграмм и функции:
ВПР - для создания плоской таблицы
СЧЕТЕСЛИ - для подсчета количеств генов на прямой и комплементарной цепи, гипотетических белков, белков, попадающих в определенный диапазон длины, генов тРНК
СЧЕТЕСЛИМН - для подсчета количеств белков, попадающих в определенный диапазон длины
СЧЕТЗ - для подсчета рибосомальных белков и РНК
ЕСЛИ, ПОИСК, ЕЧИСЛО - для поиска в названии белка слова “hypothetical”
МАКС - для определения белка с максимальной длиной
МИН - для определения белка с минимальной длиной
BINOM.DIST - для расчета вероятности данного расположения белков на цепях ДНК при случайном их распределении по цепям ДНК
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Длины белков Frankia alni
Наибольшая длина белка в протеоме Frankia alni - длина гипотетического белка, состоящего из структурного мотива coiled-coil, NAD(P)-связывающей укладки Россмана и доменов альфа/бета-гидролаз - составляет 7085 остатков, наименьшая длина у семи 20-аминокислотных гипотетических белков. На гистограмме (рисунок 1) отчетливо выделяются два пика, что свидетельствует о присутствии в протеоме бактерии двух диапазонов, в которые попадают больше всего длин белков: 496 белков имеют длину от 60 до 80 и 328 белков - от 260 до 280 аминокислотных остатков. Среди белков, длины которых попадают в диапазон 60-80, встречаются сигнальные пептиды, транскрипционные факторы, рибосомальные белки, ферредоксины и белки холодового шока, однако подавляющее большинство белков гипотетические, поэтому точно установить причину появления большого количества белков с длиной в этом диапазоне невозможно, их функция неизвестна. В диапазоне 260-280 также много гипотетических белков, но для большинства известны предполагаемые функции: многие белки связаны с метаболизмом, присутствует большое количество мембранных белков, в том числе ABC-транспортеров. Эти данные содержатся в листе “Гистограмма длин белков” сопроводительных материалов.
Распределение генов по прямой и комплементарной цепочкам ДНК
Согласно результатам изучения протеома, представленным в листе “Распределение по прямой и комплементарной цепям” сопроводительных материалов, у Frankia alni ACN14a обнаружено 6786 генов, 3369 из которых находятся на прямой цепи ДНК, а 3417 - на комплементарной. Информация о количестве генов белков, тРНК, рРНК и РНК с неизвестной функцией представлена в таблице 1.
Таблица 1. Распределение генов по прямой и комплементарной цепям ДНКЦепь ДНК | Количество | |
---|---|---|
Белки | + | 3341 |
Белки | - | 3382 |
тРНК | + | 23 |
тРНК | - | 23 |
рРНК | + | 0 |
рРНК | - | 6 |
misc* | + | 5 |
misc* | - | 6 |
Вероятность получения таких значений для всех генов, если они распределены по цепочкам ДНК случайно, составляет 28%. Для белков вероятность равна 31%, для тРНК - 56%, для рРНК - 2% и для РНК с неопределенной функцией - 50%. Скорее всего, белки, тРНК и РНК с неизвестной функцией распределены по цепям ДНК случайно, а на расположение рРНК, возможно, стоит обратить внимание.
Гипотетические белки
Анализ протеома Frankia alni ACN14a (лист “Гипотетические белки” сопроводительных материалов) показал, что 3328 белков в протеоме этой бактерии на данный момент являются гипотетическими. Это составляет 49,04% от всех генов, что свидетельствует о недостаточной изученности бактерии.
Рибосомальные белки и РНК
В таблице 2 отражены количества компонентов рибосом Frankia alni ACN14a: белков субъединицы 30S, белков субъединицы 50S, рибосомальных РНК. Их названия приведены в листе “Рибосомальные белки и РНК” в сопроводительных материалах.
рРНК | Белки 30S | Белки 50S | |
---|---|---|---|
Количество | 6 | 29 | 43 |
Количество генов тРНК
Предполагается, что особенности образа жизни Frankia alni могут отражаться в ее геноме. В сопроводительных материалах (лист “Количество генов тРНК”) представлен анализ количества разных типов тРНК. Результаты анализа приведены в виде рисунка 2 и свидетальствют о том, что существенной разницы в количествах генов тРНК аминокислот, обычно участвующих в ассимиляции азота (Glu и Gln), и в количествах генов тРНК других аминокислот не было обнаружено. Возможно, различия в количествах генов тРНК не так важны для ассимиляции азота и регуляции этого процесса, но для решения этого вопроса требуется более подробное изучение данной бактерии.
ЗАКЛЮЧЕНИЕ
В данной работе представлены результаты исследования протеома Frankia alni ACN14a: гистограммы длин белков и количеств генов тРНК, сведения о гипотетических белках, рибосомальных белках и РНК, о распределении генов по цепям ДНК. Методы работы с электронными таблицами позволили получить информацию о распределении длин белков, количестве гипотетических белков, количестве тРНК разных типов, идентифицировать белки с наибольшей и наименьшей длиной, определить количество и названия рибосомальных белков и РНК, предположить, что расположение рРНК неслучайно, количество тРНК не связано с функциями аминокислот, не относящимися к синтезу белка. Данный обзор показал, что необходимо продолжать изучать протеом Frankia alni, поскольку функции многих белков неизвестны.
СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ
СПИСОК ЛИТЕРАТУРЫ
Alloisio N. et al. (2010). The Frankia alni Symbiotic Transcriptome. Mol Plant Microbe Interact. 23:593-607
David R. Benson, Warwick B. Silvester (1993). Biology of Frankia Strains, Actinomycete Symbionts of Actinorhizal Plants. Microbiological Reviews. 57:293-319
Ghedira K. et al. (2017). The PEG-responding desiccome of the alder microsymbiont Frankia alni. Sci Rep. 8:759
Normand, P. et al. (2007). Genome characteristics of facultatively symbiotic Frankia sp. strains reflect host range and host plant biogeography. Genome Res. 17:7-15.
Pujic P. et al (2019). Omics of the early molecular dialogue between Frankia alni and Alnus glutinosa and the cellulase synton. Environmental Microbiology. 21:3328–3345