Мини-обзор генома бактерии Psychrobacter alimentarius

Аннотация

Psychrobacter alimentarius – распространенная бактерия, обитающая в ферментативных морепродуктах и холодных средах. В данной работе освещены вопросы качественного и количественного описания генома и протеома бактерии. Обзор носит описательный характер. В работе используются методы электронных таблиц и языка программирования Python.

Введение

Данная работа является мини-обзором генома бактерии Psychrobacter alimentarius. Эта грамотрицательная психрофильная бактерия была впервые выделена из традиционного южнокорейского ферментативного морепродукта – кальмара чотгал [1] , но привлекла к себе интерес из-за распространения в холодных средах (арктические почва и морская вода) [2] .

Полное секвенирование генома и предсказание генов было произведено потому, что адаптированные к холоду ферменты Psychrobacter alimentarius имеют высокий коммерческий и промышленный потенциал (низкое энергопотребление и высокая каталитическая активность при низких температурах) [3] .

Секвенирование генома Psychrobacter alimentarius, выделенных из образца породы Антарктиды, показало, что у Psychrobacter alimentarius одна кольцевая хромосома и одна кольцевая плазмида. Всего в геноме 3349444 пар нуклеоидов (из них 16905 п.н. в плазмиде и 3332539 п.н. – в хромосоме). При этом выделяют 2700 кодирующих белки последовательностей (из них 2684 расположены в хромосоме, 16 – в плазмиде) [4] .

Рис. 1. Coccoid cells of Psychrobacter alimentarius [2]

Материалы и методы

Информация о протеоме бактерии взята из базы данных NCBI Genome. Для исследования использовался штамм PAMC 27889. Для анализа данных генома и протеома бактерии использовались электронные таблицы Google Sheets и язык программирования Python.

  1. Методы работы в электронных таблицах Google sheets
    1. Подсчет количества белков определенной длины для создания Гистограммы проводился с помощью функции «COUNTIFS»;
    2. Для подсчета количества генов и белков на разных цепях ДНК использовались функции «VLOOKUP» и фильтры данных;
    3. Для наглядного представления результатов исследования использовались «Diagrams»;
    4. Для расчета вероятностей распределения генов по цепям хромосомы использовалась функция «BINOM.DIST».
  2. Язык программирования Python Для расчета нуклеотидного состава молекул ДНК генома бактерии использовался язык программирования Python версии 3.11.0

Результаты и обсуждение

В данном разделе будут представлены данные статистических исследований генома и протеома бактерии Psychrobacter alimentarius.

ОБЩАЯ ИНФОРМАЦИЯ
1) Общий размер генома Psychrobacter alimentarius составляет 3349444 пар оснований, распределенных на 2 молекулах ДНК.
2) На кольцевой хромосоме находится 3332539 п.н, а на плазмиде pP27889 – 16905 п.н.
3) GC-состав во всем геноме составляет 43% (собственный подсчет составил 42,86%), на хромосоме 43% ((собственный подсчет - 42,88%), на плазмиде 39,5% (собственный подсчет - 39,43%).
4) Количество генов в геноме Psychrobacter alimentarius – 2699. Из них кодируют белки 2630. Распределение генов по функциям представлено в Таблице 1.
Таблица 1. Распределение генов по функциям.
Что кодирует Цепь Количество Всего
Белок + 1356 2630
- 1274
РНК + 30 69
- 39

3.1 ГИСТОГРАММА ДЛИН БЕЛКОВ

Геном Psychrobacter alimentarius кодирует 2630 белков. Из них 2614 синтезируются с хромосомы, а 16 – с плазмиды. В целом, у Psychrobacter alimentarius белки имеют длину от 24 до 3422 аминокислот, а среднее значение составляет 341 аминокислоту. Исходя из гистограммы можно утверждать, что в геноме преобладают белки длиной 210-300 аминокислот.

Можно заметить, что в гистограмме можно выделить два скачка: крупный и небольшой, но достаточно заметный Такое распределение можно назвать «двугорбым» (что характерно для многих бактерий). Первая дуга принадлежит промежутку 60-540 с пиком 210-300, и вторая – 540-720.

Рис. 2. Гистограмма длин белков. По горизонтальной оси отложены промежутки, в которых находится длина белков; по вертикальной оси – число белков с длинной в данном промежутке

3.2 ЧИСЛО ГЕНОВ НА ЦЕПЯХ ХРОМОСОМЫ

Хромосома бактерии состоит из 2683 генов. На прямой цепи находится 1378 генов, на комплементарной – 1305. Подсчет представлен на листе «genes amount».

Рис. 3. Распределение генов по цепям хромосомы.

3.3 РАСПРЕДЕЛЕНИЕ БЕЛКОВ ПРОТЕОМА ПО ТИПАМ

A. ПРОТЕОМ ХРОМОСОМЫ

Протеом хромосомы бактерии представлен несколькими типами белков. Из них:

  1. Рибосомальных белков в протеоме 57. Их полный список находится в листе «ribosomal proteins». В процентном содержании это 2,18%.
  2. Число гипотетических белков (в таблице вместо их названий стоит “hypothetical protein”) бактерии – 333. Полный список гипотетических белков, х предполагаемые координаты и длины продуктов находятся в листе «hypothetical proteins». Их процентное содержание 12,74% от общего числа белков бактерии.
  3. Число транспортных белков на хромосоме - 212, а их процент от общего количества составляет 8,11%. Полный список транспортных белков находится в листе «transport proteins».
Рис. 4. Распределение белков хромосомы по типам.

Диаграмма, отражающая распределение белков, кодирующихся в хромосоме, находится на Рисунке 4. Она построена в документе сопроводительных материалов «Minireview» в листе «protein stat». На ней термином «Usual» я обозначила белки, которые не относятся ни к рибосомальным, ни к транспортным, ни к «гипотетическим».

B. ПРОТЕОМ ПЛАЗМИДЫ pPAMC27889

Протеом плазмиды бактерии представлен гипотетическими и «обычными» белками. Их соотношение приведено на Рисунке 5.

Рис. 5. Распределение белков плазмиды по типам.

3.4 РАСРЕДЕЛЕНИЕ РНК ПО ТИПАМ

В протеоме бактерии представлено 69 генов, кодирующих какой-либо тип РНК. При этом, все эти гены сосредоточены на хромосоме. Это намного меньше, чем количество кодируемых белков (2630 во всем геноме). Из 69 РНК, синтезирующихся с этих генов, можно выделить следующие группы:

  1. 1 транспортно-матричная РНК (tmRNA). В процентах она составляет 1,45%.
  2. 3 некодирующие РНК (ncRNA). От общего числа генов, кодирующих РНК, они составляют лишь 4,35%
  3. Число рибосомальных РНК (рРНК, или rRNA)- 15. Это 21,74% от всех РНК.
  4. Транспортных РНК кодируется больше всего, а именно 50 различных тРНК (tRNA). Они занимают наибольший почти три четверти всех РНК: 72,46%.
Рис. 6. Распределение РНК по типам.

Диаграмму распределения РНК, кодирующихся в генах бактерии, можно увидеть на Рисунке 6. Названия всех РНК находятся в сопроводительных материалах.

3.5 НУКЛЕОТИДНЫЙ СОСТАВ ГЕНОМНЫХ ДНК

Согласно второму правилу Чаргоффа, в последовательности одной цепочки геномной ДНК число нуклеотидов Аденина примерно равно Тимину, а число Цитозина – Гуанину: A≈T и C≈G. Проверим верность этого правила для прямых цепей хромосомы и плазмиды.

A. Хромосома (прямая цепь)
Таблица 2. Нуклеотидный состав хромосом

Нуклеотид Количество Процент Всего
A 951350 28,55% 3332539
T 952340 28,58%
C 715119 21,46%
G 713730 21,41%
Рис. 7. Нуклеотидный состав хромосомы.

Можно сделать вывод о том, что правило Чаргоффа выполняется на цепях хромосомы, так как различия составляют 0,03% для пары A-T и 0,05% для пары G-C.

Б. Плазмида (прямая цепь)
Таблица 3. Нуклеотидный состав хромосом

Нуклеотид Количество Процент Всего
A 5236 30,97% 16905
T 5005 29,6%
C 3310 19,58%
G 3358 19,85%
Рис. 8. Нуклеотидный состав плазмиды.

Можно сделать вывод о том, что правило Чаргоффа выполняется на плазмиде, но менее точно, чем на цепях хромосомы: различие между парой G-C составляет 0,27%, а вот для пары A-T оно заметно больше – 1,37%.

3.6 ГИСТОГРАММА ДЛИН МЕЖГЕННЫХ ПРОМЕЖУТКОВ

Межгенные промежутки были посчитаны для обеих цепей ДНК, так как они не зависят друг от друга. Подсчет и построение графиков произведены в листе «gene gap Histogram» в файле «Minireview» сопроводительных материалов. Я отдельно сделала график количественного распределения генов по межгенным промежуткам и график порядка этих промежутков для каждой цепи.

Существуют отрицательные значения межгенных промежутков. Это говорит о том, что в этих местах гены накладываются друг на друга (перекрываются).
По графикам можно сделать следующие выводы:

  1. Наибольшее количество генов находятся друг от друга на расстоянии 0-1000 нуклеотидов;
  2. Довольно большое число генов накладываются друг на друга.

А. Прямая (+)-цепь

Максимальное наложение генов друг на друга – 49 п.н., а максимальное расстояние между двумя генами – 25528 п.н

Рис. 9. Гистограмма длин межгенных промежутков на (+)-цепи.
Рис. 10. Порядок следования межгенных промежутков на (+)-цепи.

B. Комплементарная (-)-цепь

Максимальное наложение генов друг на друга – 49 п.н., а максимальное расстояние между двумя генами – 33976 п.н.

Рис. 11. Гистограмма длин межгенных промежутков на (-)-цепи.
Рис. 12. Порядок следования межгенных промежутков на (-)-цепи.

3.7 СЛУЧАЙНОСТЬ РАСПРЕДЕЛЕНИЯ ГЕНОВ ПО ЦЕПЯМ ХРОМОСОМЫ

На прямой цепи хромосомы находится 1378 генов из 2683. Вероятность данного распределения или распределения с большей разницей составляет 8,23%, что не противоречит предположению о случайности распределения.

Гены на плазмиде распределены поровну: 8 на прямой цепи и 8 на комплементарной. Вероятность такого распределения или распределения с большей вероятностью 59,82%, что не противоречит предположению о случайности распределения.

Расчеты случайностей распределения обеих молекул ДНК находятся в листе «accident» в документе «Minireview» сопроводительных материалов.

Сопроводительные материалы

  1. Гугл-таблица «Minireview»
  2. Полный геном Psychrobacter alimentarius
  3. Таблица особенностей

Литература

[1] Yoon JH, Yeo SH, Oh TK, Park YH. 2005 Int J Syst Evol Microbiol 55: 171–176. doi: 10.1099/ijs.0.63140-0
[2] Bozal N, Montes MJ, Tudela E, Guinea J. 2003. Int J Syst Evol Microbiol 53: 1093–1100. doi: 10.1099/ijs.0.02457-0.
[3] Van Den Burg B.2003 Curr Opin Microbiol 6: 213–218. doi: 10.1016/S1369-5274(03)00060-2.
[4] Lee J, Kwon M, Yang JY, Woo J, Hong SG, Kim O-S. 2016. Genome Announce 4(4):e00704-16. doi:10.1128/genomeA.00704-16.