Обзор генома и протеома бактерии Leptotrihia shahii

Введение

Лептотрихии (лат. Leptotrichia) — род грамотрицательных анаэробных условно-патогенных неспорообразующих бактерий.

Классификация:

Cellular organisms

Bacteria

Fusobacteria

Fusobacteriia

Fusobacteriales

Leptotrihiaceae

Leptotrihia

Leptotrihia shahii

Ранее назывались лептотрикс (лат. Leptothrix). Лептотрихии имеют прямых или изогнутых тонких или толстых длинных cо слабозаостренными или прямыми концами палочек размером 1–1,5 на 5–15 мкм, нередко объединяющихся в длинные нити. Лептотрихии образуют капсулы. Оптимальная температура для роста лептотрихий — от 35 до 37°С. При температуре ниже 25°С и выше 45°С лептотрихии не растут. Для роста необходимо присутствие CO2 и анаэробные условия.

Лептотрихии (в основном, вид Leptotrichia buccalis) обитают в ротовой полости и входят в состав микрофлоры, формирующей зубные бляшки. Leptotrichia buccalis считается врожденной микрофлорой ротовой полости. В норме у взрослого человека в полости рта в титре содержится 102–104 КОЕ/г лептотрихий. Разные виды лептотрихий имеются у более чем 40 % детей до года. Другие виды лептотрихий: Leptotrichia goodfellowii, Leptotrichia hofstadii, Leptotrichia shahii, Leptotrichia wadeii и иные в норме в небольшом количестве встречаются во влагалище. Лептотрихии иногда обнаруживаются в толстой кишке здорового человека. [1]

Материалы и методы

С сайта [2] я скачал файл с данными о геноме и протеоме исследуемой бактерии. Для работы с файлами я использовал программы, которые я писал в colab.research.google.com на языке программирования Python и таблицы docs.google.com для систематизации и оценки данных.

Результаты исследований

GC состав

Геном бактерии Leptotrihia shahii находится на одной хромосоме. Её процентный состав приведён в таблице [А].

По результатам видно, что в геноме бактерии выполняется правило Чаргаффа. Количество аденина примерно равно количеству тимина.

ДНК состоит из гуанина(G), цитозина(C), тимина(T) и аденина(A). Связь между А и Т - двойная, а между G и C – тройная, более прочная. Из-за чего и происходит корреляция между устойчивостью ДНК и процентным содержанием в ней гуанина и цитозина.

В геноме Leptotrihia shahii аденина и тимина значительно больше, чем гуанина и цитозина (~2,36 раза). Это сигнализирует о том, что бактерия не приспособлена к экстремальным условиям.

Частоты стоп-кодонов

Стоп-кодон или кодон терминации — тройка нуклеотидных остатков в мРНК, кодирующая прекращение (терминацию) синтеза полипептидной цепи (трансляции). Стандартные стоп-кодоны — УАА, УАГ и УГА (UAA, UAG, UGA).

Стоп-кодоны выполняют важную функцию завершения (терминацию) сборки полипептидной цепи и также называются терминаторными кодонами. Некоторые из них вызывают обязательное прекращение синтеза, другие являются условными.

Кроме того, стоп-кодон, как кодон, при котором не происходит включения аминокислоты в белок, ещё называют бессмысленным кодоном или нонсенс-кодоном.

Так, кодон UAG (Янтарь) — условный терминаторный кодон и супрессируемые Amber-мутации вызывают преждевременную терминацию трансляции (условно летальные мутации).

Сквозная трансляция может проходить через кодоны UAG (Янтарь) и UGA (Опал), но не через кодон UAA (Охра).

Кодоны UAA и UAG в митохондриальной ДНК вызывают безусловное прекращение трансляции.

Некоторые мРНК в действительности содержат два тандемных терминаторных кодона — часто это кодоны различного типа на конце кодирующей последовательности.[3]

Результаты исследования занесены в таблицу [В]

Все гены оканчивающиеся нестандартными стоп-кодонами – псевдогены.

Распределение генов , кодирующих белки, на цепи ДНК

Результаты исследования приведены в таблице [C]. Для цепи ДНК степень случайности равна 0. Ксения Коваленко, [26.10.2022 18:59] 0029426, что мало, а значит, статистически значимо. Ген tmRNA встречается лишь на одной из двух цепочек и, возможно, высполняет специфические функции.

Анализ длин белков

Результаты исследований приведены на диаграмме [D]. Максимальная длина белка – 3638, а минимальная – 30, средняя длина – 308, медиана – 257, стандартное отклонение – 243.45 . Большая часть белков имеет длину от 56 до 331 аминокислоты.

ВЫВОД

В ходе исследований я собрал немного статистических данных, которые помогут мне в дальнейшем изучении бактерии.

Сопроводительные материалы

Гугл таблица для 3.3 и 3.4

Таблица А:

Нуклеотид Adenine Thymine Guanine Cytosine
Доля 0.3335 0.3598 0.1304 0.1638

Таблица В:

Стоп-кодон Часто встречаемости
TGA ~7.65306%
TAA ~71.27551%
TAG ~20.86735%
Другие ~0.20408%

Таблица С:

Тип гена Прямая цепь (+) Обратная цепь (-)
CDS 1046 1326
Gene 1073 950
ncRNA 2 1
tRNA 9 6
tRNA 17 45
tmRNA - 1

Гистограмма D

Гистограмма D

СПИСОК ЛИТЕРАТУРЫ

1. https://www.gastroscan.ru/handbook/118/4023

2.https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/008/327/825/GCF_008327825.1_ASM832782v1/

3. https://bmcinfectdis.biomedcentral.com/articles/10.1186/s12879-018-3495-9

4.https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?mode=Info&id=157691

5.https://ru.wikipedia.org/wiki/Стоп-кодон