Мини обзор генома бактерии Liquorilactobacillus hordei DSM 19519

Скоморохов Глеб Егорович

Московский Государственный Университет имени М. В. Ломоносова,
факультет биоинженерии и биоинформатики

1 ВВЕДЕНИЕ

Изучаемый организм принадлежит к домену Bacteria, типу Bacillota, классу Bacilli, порядку Lactobacillales, семейству Lactobacillaceae, роду Liquorilactobacillus. Проще говоря, к известным молочнокислым бактериям, используемым в производстве одноимённой пищевой продукции.

2 МАТЕРИАЛЫ И МЕТОДЫ

  1. Гистограмма длин белков бактерии Liquorilactobacillus hordei DSM 19519 была построена при помощи электронных таблиц.
  2. Определение всех стоп-кодонов отдельно для генов и псевдогенов реализовано с помощью языка Python.
  3. Анализ частоты встречаемости аминокислот в геноме бактерии, а также частоты встречаемости 3 аминокислот подряд. Реализован на языке Python.

3 РЕЗУЛЬТАТЫ

3.1 Гистограмма длин белков бактерии Liquorilactobacillus hordei DSM 19519

Гистограмма длин белков

Рис. 1 Гистограмма длин белков

Гистограмма показывает, что большая часть белков имеет длину 0-500 аминокислотных остатков.

3.2 Определение всех стоп-кодонов отдельно для генов и псевдогенов

Стоп-кодоны генов

Рис. 2 Стоп-кодоны генов

Стоп-кодоны псевдогенов

Рис. 3 Стоп-кодоны псевдогенов

Как видно из гистограмм, у генов преобладают стандартные стоп-кодоны TAA, TAG, TGA, преобладает первый из них.

У псевдогенов, напротив, большое разнообразие стоп-кодонов, но TAA, TAG, TGA также встречаются чаще всего. Это может быть связано с тем, что псевдогены подвергались мутациям.

3.3 Анализ частоты встречаемости аминокислот в геноме бактерии

Частота встречаемости аминокислот

Рис. 4 Частота встречаемости аминокислот в геноме бактерии

Можно заметить, что чаще всего встречается Лейцин. Количество лейцина в геноме составляет 69958, что составляет 10.93% всего генома.

Наборы из 3 аминокислот

Рис.5 Наборы из 3 аминокислот, встречающиеся в геноме более 200 раз

Во всех найденных наборах присутствует Лейцин, в большинстве из них содержат 2 и более Лейцина. Это говорит о необходимости Лейцина для создания неких общих структур у белков. Это объясняет результаты первой части 3.3.

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

Ссылка на таблицу с гистограммой Ссылка на код пункта 2 Ссылка на код пункта 3 Исходные данные: фаста-файл с геномом бактерии и таблица генов

СПИСОК ЛИТЕРАТУРЫ

[1] Yannis Nevers, Natasha Glover, Christophe Dessimoz, Odile Lecompte. Protein length distribution is remarkably consistent across Life. Biorxiv. doi: https://doi.org/10.1101/2021.12.03.470944
[2] Swart EC, Serra V, Petroni G, Nowacki M. Genetic Codes with No Dedicated Stop Codon: Context-Dependent Translation Termination. Cell. 2016 Jul 28;166(3):691-702. doi: 10.1016/j.cell.2016.06.020.
[3] Большая Российская энциклопедия статья Лейцин https://bigenc.ru/c/leitsin-68fe51
[4] Ramoneda J, Jensen TBN, Price MN, Casamayor EO, Fierer N. Taxonomic and environmental distribution of bacterial amino acid auxotrophies. Nat Commun. 2023 Nov 22;14(1):7608. doi: 10.1038/s41467-023-43435-4.
[5] Rocha J, Botelho J, Ksiezarek M, Perovic SU, Machado M, Carriço JA, Pimentel LL, Salsinha S, Rodríguez-Alcalá LM, Pintado M, Ribeiro TG, Peixe L. Lactobacillus mulieris sp. nov., a new species of Lactobacillus delbrueckii group. Int J Syst Evol Microbiol. 2020 Mar;70(3):1522-1527.