Янкович Иван
Факультет биоинженерии и биоинформатики, Московский государственный университет имени М. В. Ломоносова
В этой работе описывается исследование генома и протеома бактерии roseobacter denitrificans , в котором были изучены соотношение различных нуклеотидов в последовательности ДНК, проанализировано распределение длин белков бактерии и расположение на прямой и обратной цепи ДНК рибосомальных белков и РНК. Кроме этого были определены функциональные классы закодированных в геноме РНК и соотношение количеств различных тРНК.
Roseobacter denitrificans это свободноживущая аэробная бактерия с розовой окраской. Клетки имеют яйцевидную или палочковидную форму и двигаются за счет жгутиков. Бактерия обитает в почве, на поверхности океана и вблизи гидротермальных источников. Бактерия не производит кислород, но он ей требуется для роста. Причем необходим низкий уровень кислорода. При чрезмерном количестве фотосинтетический аппарат клетки угнетается и бактерия растет хемотрофно с использованием органического углерода.1 Этот вид уникален тем , что может двигаться без образования розеток. Первичный фотосинтетический аппарат – бактериохлорофилл а. Бактерия может перерабатывать органические фосфаты. Так как у нее апоксигенный фотосинтез, она окисляет монооксид углерода парникового газа и производит диметилсульфид.За счет разложения водорослей она влияет на климат.1 Для человека безвредна и не вызывает никаких патологий. Бактерию применяют для изучения воздействия кислорода на фотосинтетические и метаболические процессы, так как она способна к росту без кислорода, используя нитрат в качестве акцептора электронов.
Информация о геноме бактерии получена с использованием базы данных NCBI
Функции Excel, использованные в работе:
• Фильтр (выбрать определенные столбцы)
• Сортировка(упорядочить строчки)
• ВПР(связь таблиц,принимает на вход 4 аргумента)
Анализ встречаемости каждого нуклеотида с помощью программы wordcount -wordsize 1 приводит к результату, отраженному в таблице 1.
В соответствии с полученными данными,в геноме roseobacter denitrificans встречаются азотистые основания: аденин, тимин, гуанин и цитозин, причем чаще всего встречается цитозин (834062 нуклеотидов), а реже всего – тимин (619085 нуклеотида). Кроме того, количества нуклеотидов, содержащих аденин и тимин, а также гуанин и цитозин приблизительно равны, что подтверждает верность первого правила Чаргаффа.
Результат исследования типов генов, находящихся в геноме roseobacter denitrificans , позволяет получить следующую таблицу (таблица 2) с их встречаемостью.
По полученным данным, можно отметить, что для данной бактерии характерно наличие большого количества генов, кодирующих белки (3947) для генома такого размера.
На гистограмме показана частота встречаемости белков различной длины в протеоме roseobacter denitrificans. Согласно исследованию, длины большей части генов лежат в пределах от 1000 до 3000 аминокислотных остатков, а пик гистограммы соответствует интервалу 2000-2500 остатков (839 белков)
В результате анализа генов, кодирующих РНК, было выяснено, что в геноме roseobacter denitrificans закодировано 44 РНК, в таблице 3 представлено распределение РНК по функциям. Было сделано исследование видов тРНК, присутствующих в геноме, в результате чего было выяснено, что в больше всего в геноме бактерии представлены гены тРНК, присоединяющей лейцин (5 генов), а также аргинин и серин (по 4 гена). Это распределение коррелирует с распределением количеств триплетов, кодирующих каждую аминокислоту (лейцин,аргинин, серин – 6; аспарагин, аспартат, цистеин, фенилаланин, тирозин - 2, триптофан – 1), что может говорить о том, какие аминокислоты чаще встречаются в белках бактерии.
В результате анализа свойств генома и протеома бактерии были определены некоторые важные для последующих исследований параметры, такие как распределение генов на прямой и обратной цепи ДНК, вероятно является случайным. Данные признаки могут быть важны для дальнейшей работы с культурой бактерии и модифицирования её генома с теми или иными целями. Кроме того определены максимальные, минимальные и наиболее часто встречающиеся длины белков изучаемого организма и встречаемость в геноме тРНК связывающихся с различными аминокислотами.
Хромосомная таблица и материалы исследования