IMPERIAL

Мини-обзор генома и протеома бактерии Roseburia intestinalis L1-82


Введение


Roseburia intestinalis L1-82( или Кишечная розбурия штамм L1-82 (DSM 14610)) относится к типу штаммов бактерии и является одним из представителей нормальной микробиоты кишечника человека. Roseburia intestinalis - это сахаролитическая бактерия, производящая бутират, впервые выделенная из человеческих фекалий. Эта бактерия является анаэробной и грамположительно. Она не образует споры, слегка изогнута в форме стержня и активно передвигается с помощью множества субтерминальных жгутиков [1].. Бактерия имеет только одну хромосому. По современной систематике вид Roseburia intestinalis относится к роду Roseburia, который входит в семейство Lachnospiraceae, порядок Clostridiales, класс Clostridia, тип Firmicutes, царство Бактерии.


Результаты ряда исследований указывают, что для лиц с ожирением и сахарным диабетом 2-го типа характерны глубокие изменения состава кишечной микрофлоры, в частности уменьшение содержания видов, активно вырабатывающих бутират: Roseburia intestinalis L1-82 [2] У пациентов с болезнью Паркинсона содержание Roseburia intestinalis L1-82 в кишечнике понижено, по сравнению со здоровыми людьми (исследование выполнено на американской популяции). Наличие других неврологических заболеваний, наоборот, ассоциировано с увеличением содержания Roseburia intestinalis[2] В этой работе проведен качественный и количественный анализ генома и протеома бактерии Roseburia intestinalis L1-82. В данном мини-обзоре рассматриваются и анализируются базовые особенности генома и протеома бактерии с помощью простых биоинформатических методов. Исследуются кодирующие белок последовательности и составляющие их триплеты нуклеотидов, а также особенности распределения последовательностей по кольцевой ДНК бактерии.


Bacteria
Рис .1 Фотография Roseburia intestinalis L1-82

Материалы и методы


В ходе исследования генома и протеома бактерии _ использовались файлы:


GCF_900537995.1_Roseburia_intestinalis_strain_L1-82_feature_table.txt

GCF_900537995.1_Roseburia_intestinalis_strain_L1-82_genomic.fna


Которые были скачаны и распакованы с сайта:


САЙТ-ИСТОЧНИК


Данные таблицы №1 были получены с помощью Программы №1 и Программы №2, а таблица составлена с помощью инструментов таблицы в Word. Данные таблиц №2, 4 были получены с помощью Программы №5 и составлены с помощью инструментов таблицы в Word. Гистограмма длин белок-кодирующих участков генома была получена и оформлена в среде ЕXCEL. Также с её помощью были получены данные Таблицы №3, использовалась статистическая функция BINOM.DIST для оценки вероятности. Классы белков определялись по названиям, а классы молекул РНК - по типам последовательностей в хромосомных таблицах


Результаты


В ходе исследования генома Roseburia_intestinalis_L1-82 с помощью программы №1 выяснилось, что бактерия имеет всего одну последовательность ДНК – “NZ_LR027880.1” c длиной 4549515 нуклеотидов. GC-состав данной последовательности равен 0.4266 или 42,66 %. Длина последовательности и её GC-cостав был определен с помощью скрипта №2.


Таблица №1

Из полученных данных становится ясно, что выполняется второе правило Чарграффа. Это исходит из того, что количество нуклеотидов “A” и “T”, “C” и “G” приблизительно равно друг другу. В ходе поиска программа не обнаружила других символов кроме как ’A’ , ’T’ , ’C’ , ’G’.


Таблица №2

С помощью программы № 5 найдем частоту встречаемости стоп-кодонов в кодирующих последовательностях белков. Из полученных данных видно, что наиболее популярными стоп-кодонамм являются TGA и TAG кодоны, а наиболее редким TAA кодон.


Таблица №3

Наиболее часто встречающимся кодоном, кодирующим тирозин, является ТАТ. С достаточно большим отрывом ему уступает кодон ТАС.


Таблица №4

Наиболее часто встречающимся кодоном, кодирующим тирозин, является ТТТ. С достаточно большим отрывом ему уступает кодон ТТС.


Гистограмма

Также с помощью электронных таблиц найдены некоторые статистические параметры для распределения длин белков. Средняя длина белка (функция AVERAGE) составила 326 аминокислотных остатка, а медиана (функция MEDIAN), то есть наиболее часто встречающиеся значение - 285. При этом стандартное квадратичное отклонение (STDEV.P) равно 227,8. Минимум равен 22, а максимум 2839.


Распределение

С помощью статистической функции BINOM.DIST оценим вероятность такого распределения генов, как оказалось вероятность получить такое распределение достаточно высока. Распределение среди различных типов генов равномерное.


Заключение и обсуждение


В результате, в рамках мини-обзора рассмотрены некоторые особенности генома и протеома бактерии Roseburia_intestinalis_strain_L1-82, которые могут послужить основой для дальнейших исследований в данной области, в том числе, и имеющих практический характер.


Cопроводительные материалы


Ссылка на таблицу EXCEL со всем статистическим анализом:


ТАБЛИЦА EXCEL


Ссылка на Программу №1:


ПРОГРАММА №1


Ссылка на Программу №2:


ПРОГРАММА №2


Ссылка на Программу №3:


ПРОГРАММА №3


Ссылка на Программу №4:


ПРОГРАММА №4


Ссылка на Программу №5:


ПРОГРАММА №5


Cсылка на исходные данные:


Файл feature_tables


FEATURE_TABLES


Файл FASTA:


FASTA