Мини-обзор генома и протеома бактерии Amycolatopsis keratiniphila

Емельянова Алина

1 курс, Факультет биоинженерии и биоинформатики

РЕЗЮМЕ

Статья написана с целью исследовать геном и протеом бактерии Amycolatopsis keratiniphila. В ходе работы был проанализирован геном и протеом бактерии, построены графики и таблицы для представления полученных результатов.

КЛЮЧЕВЫЕ СЛОВА

Кератин, GC-содержание, геном, протеом, Amycolatopsis.

ВВЕДЕНИЕ

Amycolatopsis keratiniphila - это аэробный грамположительный организм, продуцирующий светло-серый воздушный мицелий, но без специфических цепочек спор. В стареющих культурах мицелий распадается на структуры, подобные спорам. Бактерия была выделена из болотной почвы Кувейта методом наживки с использованием шерсти животных. Анализ последовательности 16S рДНК, хемотаксономические маркеры и физиологическая характеристика бактерии позволили определить, что Amycolatopsis keratiniphila - это вид в пределах рода Amycolatopsis. Ближайший филогенетический сосед - Amycolatopsis japonica - демонстрирует 99,4% сходства в последовательности 16S рДНК с Amycolatopsis keratiniphila.

Рис 1. Схема, основанная на последовательности 16S рДНК, показывающая положение A. keratinifila и связывающая виды в пределах рода Amycolatopsis.

Бактерия Amycolatopsis keratiniphila способна продуцировать антибиотики, активные против метициллин-резистентных стафилококков, а также способна разрушать материи, состоящие из кератина, в том числе волосы, рога, перья.

Рис 2. Фотография Amycolatopsis keratiniphila в микроскопе

2 МАТЕРИАЛЫ И МЕТОДЫ

Таблицы и материалы по данной бактерии были получены по ссылке

Гистограмма 2 построена в электронных таблицах с помощью функции COUNTIFS

Средняя длина участка, стандартное отклонение, медиана, минимальное и максимальное значение рассчитаны в электронных таблицах с помощью функций AVERAGE, STDEV.P, MEDIAN, MIN и MAX соответственно.

Названия ДНК, Таблица 4 и количество букв в последовательностях получено с помощью программ, написанных на Python, доступных по ссылке

3 РЕЗУЛЬТАТЫ

3.1 Длины белков

Из Гистограммы 1 видно, что в геноме Amycolatopsis keratiniphila чаще всего ( более 1000 раз) встречаются белки длиной 200 - 250.

Гистограмма 1. Сравнение длин белков

Из Таблицы 1 видно, что среди самых длинных белков много non-ribosomal peptide synthetase.

Белок Длина
1 hypothetical protein 11866
2 hypothetical protein 11286
3 non-ribosomal peptide synthetase 7403
4 non-ribosomal peptide synthetase 5854
5 type I polyketide synthase 5099
6 non-ribosomal peptide synthetase 4944
Таблица 1. 6 самых длинных белков A. keratinifila

Самые короткие белки представлены в Таблице 2:

Белок Длина
1 pyrroloquinoline quinone precursor peptide PqqA 31
2 AURKAIP1/COX24 domain-containing protein 33
3 K(+)-transporting ATPase subunit F 33
4 50S ribosomal protein L36 37
5 hypothetical protein 45
6 hypothetical protein 46
Таблица 2. 6 самых коротких белков A. keratinifila

В Таблице 3 приведены: средняя длина белка, стандартное отклонение, медиана, минимальное значение и максимальное.

Средняя длина 330,97
Стандартное отклонение 321,6
Медиана 281
Минимальное значение 31
Максимальное значение 11866
Таблица 3. Описательная статистика белков Amycolatopsis keratiniphila
3.2 Распределение генов в ДНК

Из Таблицы 4 можно понять, что в ДНК NC_021252.1 генов белков и РНК больше на прямой цепи, а псевдогенов - на обратной.

+ -
protein_coding 4105 3979
pseudogene 34 48
RNA 43 22
Таблица 4. Число генов белков, псевдогенов и генов РНК на прямой и обратной цепи ДНК NC_021252.1

Вероятность такого распределения генов белков в ДНК NC_021252.1 равна 0,00012, то есть она мала.

Из Таблицы 5 видно, что в ДНК плазмиды NC_023497.1 нет генов РНК и псевдогенов, а число генов белков больше на обратной цепи.

+ -
protein_coding 4105 3979
pseudogene 34 48
RNA 43 22
Таблица 5. Число генов белков, псевдогенов и генов РНК на прямой и обратной цепи ДНК NC_023497.1

Вероятность такого распределения генов белков в ДНК NC_021252.1 равна 0,02.

3.3 Исследование генома

Число ДНК бактерии = 2, названия ДНК:

NC_021252.1

NC_023497.1

GC-содержание в двух ДНК представлено в Таблице 6.

ДНК GC-содержание Число GC Длина ДНК
NC_021252.1 0,6901 6175088 8948591
NC_023497.1 0,6890 23081 33499
Таблица 6, отражающая GC-содержание ДНК

Нуклеотиды, встречающиеся в каждой ДНК:

NC_021252.1 NC_023497.1
G 3081289 11701
T 1382605 5373
C 3093799 11380
A 1390898 5045

В последовательностях нет нуклеотидов, кроме A, T, G и C. Второе правило Чаргаффа работает: число A примерно равно числу T, и число C примерно равно числу G.

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

Использованные материалы, графики, таблицы и программы доступны по ссылке

БЛАГОДАРНОСТИ

Благодарю преподавателей биоинформатики за полученные знания и помощь в написании мини-обзора.

ССЫЛКИ НА ИСТОЧНИКИ

1. Int J Syst Evol Microbiol. 2003 May;53(Pt 3):871-874. Amycolatopsis keratiniphila sp. nov., a novel keratinolytic soil actinomycete from Kuwait. Azza A Al-Musallam , Sheikha S Al-Zarban , Yunis A Fasasi , Reiner M Kroppenstedt , Erko Stackebrandt

https://pubmed.ncbi.nlm.nih.gov/12807215/

2. Systematic and Applied Microbiology

Volume 26, Issue 1, 2003, Pages 38-46. Joachim M.Wink, Reiner M.Kroppenstedt, Bimal N.Ganguli, Suresh R.Nadkarni, Peter Schumann, Gerhard Seibert, Erko Stackebrandt.

https://www.sciencedirect.com/science/article/abs/pii/S0723202004701575

3. INTERNATIONAL JOURNAL OF SYSTEMATIC AND EVOLUTIONARY MICROBIOLOGY Volume 53, Issue 3. Amycolatopsis keratiniphila sp. nov., a novel keratinolytic soil actinomycete from Kuwait. Azza A. Al-Musallam, Sheikha S. Al-Zarban, Yunis A. Fasasi, Reiner M. Kroppenstedt, Erko Stackebrandt

https://www.microbiologyresearch.org/docserver/fulltext/ijsem/53/3/871.pdf?expires=1635191375&id=id&accname=guest&checksum=80F523938D076D5CB9A2720DC8A244A7