Psychrobacter alimentarius – распространенная бактерия, обитающая в ферментативных морепродуктах и холодных средах. В данной работе освещены вопросы качественного и количественного описания генома и протеома бактерии. Обзор носит описательный характер. В работе используются методы электронных таблиц и языка программирования Python.
Данная работа является мини-обзором генома бактерии Psychrobacter alimentarius. Эта грамотрицательная психрофильная бактерия была впервые выделена из традиционного южнокорейского ферментативного морепродукта – кальмара чотгал [1] , но привлекла к себе интерес из-за распространения в холодных средах (арктические почва и морская вода) [2] .
Полное секвенирование генома и предсказание генов было произведено потому, что адаптированные к холоду ферменты Psychrobacter alimentarius имеют высокий коммерческий и промышленный потенциал (низкое энергопотребление и высокая каталитическая активность при низких температурах) [3] .
Секвенирование генома Psychrobacter alimentarius, выделенных из образца породы Антарктиды, показало, что у Psychrobacter alimentarius одна кольцевая хромосома и одна кольцевая плазмида. Всего в геноме 3349444 пар нуклеоидов (из них 16905 п.н. в плазмиде и 3332539 п.н. – в хромосоме). При этом выделяют 2700 кодирующих белки последовательностей (из них 2684 расположены в хромосоме, 16 – в плазмиде) [4] .
Информация о протеоме бактерии взята из базы данных NCBI Genome. Для исследования использовался штамм PAMC 27889. Для анализа данных генома и протеома бактерии использовались электронные таблицы Google Sheets и язык программирования Python.
В данном разделе будут представлены данные статистических исследований генома и протеома бактерии Psychrobacter alimentarius.
Что кодирует | Цепь | Количество | Всего |
Белок | + | 1356 | 2630 |
- | 1274 | ||
РНК | + | 30 | 69 |
- | 39 |
Геном Psychrobacter alimentarius кодирует 2630 белков. Из них 2614 синтезируются с хромосомы, а 16 – с плазмиды. В целом, у Psychrobacter alimentarius белки имеют длину от 24 до 3422 аминокислот, а среднее значение составляет 341 аминокислоту. Исходя из гистограммы можно утверждать, что в геноме преобладают белки длиной 210-300 аминокислот.
Можно заметить, что в гистограмме можно выделить два скачка: крупный и небольшой, но достаточно заметный Такое распределение можно назвать «двугорбым» (что характерно для многих бактерий). Первая дуга принадлежит промежутку 60-540 с пиком 210-300, и вторая – 540-720.
Хромосома бактерии состоит из 2683 генов. На прямой цепи находится 1378 генов, на комплементарной – 1305. Подсчет представлен на листе «genes amount».
A. ПРОТЕОМ ХРОМОСОМЫ
Протеом хромосомы бактерии представлен несколькими типами белков. Из них:
Диаграмма, отражающая распределение белков, кодирующихся в хромосоме, находится на Рисунке 4. Она построена в документе сопроводительных материалов «Minireview» в листе «protein stat». На ней термином «Usual» я обозначила белки, которые не относятся ни к рибосомальным, ни к транспортным, ни к «гипотетическим».
B. ПРОТЕОМ ПЛАЗМИДЫ pPAMC27889
Протеом плазмиды бактерии представлен гипотетическими и «обычными» белками. Их соотношение приведено на Рисунке 5.
В протеоме бактерии представлено 69 генов, кодирующих какой-либо тип РНК. При этом, все эти гены сосредоточены на хромосоме. Это намного меньше, чем количество кодируемых белков (2630 во всем геноме). Из 69 РНК, синтезирующихся с этих генов, можно выделить следующие группы:
Диаграмму распределения РНК, кодирующихся в генах бактерии, можно увидеть на Рисунке 6. Названия всех РНК находятся в сопроводительных материалах.
Согласно второму правилу Чаргоффа, в последовательности одной цепочки геномной ДНК число нуклеотидов Аденина примерно равно Тимину, а число Цитозина – Гуанину: A≈T и C≈G. Проверим верность этого правила для прямых цепей хромосомы и плазмиды.
A. Хромосома (прямая цепь)
Таблица 2.
Нуклеотидный состав хромосом
Нуклеотид | Количество | Процент | Всего |
A | 951350 | 28,55% | 3332539 |
T | 952340 | 28,58% | |
C | 715119 | 21,46% | |
G | 713730 | 21,41% |
Можно сделать вывод о том, что правило Чаргоффа выполняется на цепях хромосомы, так как различия составляют 0,03% для пары A-T и 0,05% для пары G-C.
Б. Плазмида (прямая цепь)
Таблица 3.
Нуклеотидный состав хромосом
Нуклеотид | Количество | Процент | Всего |
A | 5236 | 30,97% | 16905 |
T | 5005 | 29,6% | |
C | 3310 | 19,58% | |
G | 3358 | 19,85% |
Можно сделать вывод о том, что правило Чаргоффа выполняется на плазмиде, но менее точно, чем на цепях хромосомы: различие между парой G-C составляет 0,27%, а вот для пары A-T оно заметно больше – 1,37%.
Межгенные промежутки были посчитаны для обеих цепей ДНК, так как они не зависят друг от друга. Подсчет и построение графиков произведены в листе «gene gap Histogram» в файле «Minireview» сопроводительных материалов. Я отдельно сделала график количественного распределения генов по межгенным промежуткам и график порядка этих промежутков для каждой цепи.
Существуют отрицательные значения межгенных промежутков. Это говорит о том, что в этих местах гены накладываются друг на друга (перекрываются).
По графикам можно сделать следующие выводы:
А. Прямая (+)-цепь
Максимальное наложение генов друг на друга – 49 п.н., а максимальное расстояние между двумя генами – 25528 п.н
B. Комплементарная (-)-цепь
Максимальное наложение генов друг на друга – 49 п.н., а максимальное расстояние между двумя генами – 33976 п.н.
На прямой цепи хромосомы находится 1378 генов из 2683. Вероятность данного распределения или распределения с большей разницей составляет 8,23%, что не противоречит предположению о случайности распределения.
Гены на плазмиде распределены поровну: 8 на прямой цепи и 8 на комплементарной. Вероятность такого распределения или распределения с большей вероятностью 59,82%, что не противоречит предположению о случайности распределения.
Расчеты случайностей распределения обеих молекул ДНК находятся в листе «accident» в документе «Minireview» сопроводительных материалов.