В данном обзоре представлен анализ генома и протеома бактерии Aeromicrobium erytheum. Вся работа была выполнена посредствам электронных таблиц (Microsoft Excel) и команд в интерпретаторе bash. Был проведен анализ длины генома, нуклеотидный состав, типов генов, определена частота GC-пар. Так же было проведено исследование 2 и 3-меров. Ключевые слова: бактерия, геном, ген, протеом, белок, Aeromicrobium erytheum, Excel.
Aeromicrobium erythreum – это бактерия из рода Aeromicrobium. Была выделена из почвы в Пуэрто Рико[1] сравнительно недавно, в 1991 году. Aeromicrobium erytheum имеет важную роль в современном мире. Она синтезирует антибиотик класса макролидов – эритромицин, применяемый в свою очередь для лечения бактериальных инфекций, вызванных чувствительными возбудителями, инфекций ЛОР-органов, желчевыводящих путей, а также верхних и нижних дыхательных путей. Бактерия была выделена из почвы в Пуэрто Рико в 1991 году. Aeromicrobium erytheum имеет важную роль в современном мире. Она синтезирует антибиотик класса макролидов – эритромицин, применяемый в свою очередь для лечения бактериальных инфекций, вызванных чувствительными возбудителями, инфекций ЛОР-органов, желчевыводящих путей, а также верхних и нижних дыхательных путей. Таксономия [2]: Bacteria, Actinobacteria, Propionibacteriales, Nocardioidaceae, Aeromicrobium Данные, представленные в работе, были получены главным образом с помощью электронных таблиц и команд в интерпретаторе bash.
Последовательность ДНК бактерии была взята из открытой базы данных NCBI [3]. Во время работы с электронными таблицами (Microsoft Excel), использовались различные методы, такие как:
Длина генома Aeromicrobium erythreum равна 3,629,239 нуклеотидов.
В состав генома ДНК данной бактерии входят нуклеотиды A, T, G, C. В таблице 1(сопроводительные материалы лист 1) представлено процентное соотношение нуклеотидов в геноме бактерии.
Так же было подсчитано количество комплементарных нуклеотидных пар по правилу Чаргаффа, результаты представлены в таблице 2(сопроводительные материалы лист 2).
Проведя анализ протеома, можно сделать вывод, что длины белков колеблются от 29 до 3580. При этом большая часть белков имеют длину в диапазоне от 188 до 241. Средняя длина белка 319,42. (см. Гистограмма 1, а так же данные представлена в сопроводительных материалах лист 3).
Из таблицы 3 (сопроводительные материалы лист 4) видно, что чаще всего встречаются гены, кодирующие белки, 3373. Следующие по чатоте встречаемости гены, кодирующие tRNA, 47. Количество псевдогенов равно 42. Реже всего встречаются гены, кодирующие tmRNA, SPR RNA RNase P RNA, их количество равно 1.
На диаграмме 1 (сопроводительные материалы лист 4) визуально представлено количественное соотношение типов генов.
По таблице 4 (сопроводительные материалы лист 5) можно сказать, что большая часть генов имеет прямую ориентацию, однако разница с генами, имеющими обратную ориентацию, не большая.
Количество k-меров длины три в геноме равно 64. Важно отметить, что ни один k-меров не представлен полностью. Данные представленные в гистограмме 1 (сопроводительные материалы лист 6).
В ходе работы был проведен анализ генома и протеома бактерии Aeromicrobium erythreum, в результате чего мы получили различные данные, которые требуют дальнейшего более подробного анализа.
Ссылка на Google диск: Google-таблица с результатами