Авторство: Конкин Максим , студент первого курса Факультета Биоинженерии и Биоинформатики
Email: makson753@fbb.msu.ru
Работа по изучению Mycolicibacterium madagascariense, таксономии, качеств бактерии, старт- и стоп- кодонов, характеристики белков.
Начать исследование стоило с ознакомления с систематической принадлежностью Mycolicibacterium madagascariense (табл.1), стоит отметить, что полное научное название бактерии — Mycobacterium madagascariense Kazda et al. 1992 год [1]. Впервые быстрорастущие скотохромогенные микобактерии были выделены из трех различных биотопов сфагнума на Мадагаскаре. Эти бактерии растут при 31 и 22 градусах Цельсия, но не растут при 37, что отличает их от близкородственных видов. Уровень внутреннего сходства штаммов составил 92,5%. Mycolicibacterium madagascariense обладали каталазой, кислой фосфатазой и арилсульфотазной активностью, расщепляли мочевину и пиразинамид [2]. Колонии бактерий - гладкие и блестящие колонии с желтой или оранжевой пигментацией (диаметр 1-2 мм).
Была проведена работа по изучению белков, генома и общих свойств бактерии, таких как: неподвижность, кислотоустойчивость и грамм-положительность.
В качестве исходных данных для анализа генома и протеома использовались следующие файлы, взятые из базы данных NCBI [4]. Для определения и подсчёта кодонов, а также для исследования GC-содержания использовались скрипты на Python [1]. Ресурсы Google Таблицы использовались для анализа количества белков различной длины, и систематики информации о каждом из белков [2]. Для поиска систематических данных и описания морфологии использовался сайт [1].
Работа началась с анализа белков Corynebacterium ureicelerivorans. Проведя небольшое исследование белковых последовательностей, получилось составить гистограмму длины белков к их количеству в бактерии (табл.2). Общее количество белков, закодированных в геноме бактерии 5497, при этом их длины расположены в промежутке от 29 до 7461 аминокислотных остатков. Из диаграммы следует, что наибольшее количество белков имеют длину 200-299.
Для поиска самых коротких белков был проведён анализ белков в диапазоне 0-50 (табл. 3). Первые значения появляются в диапазоне 29-30, значит эта длина самых коротких белков в бактерии, и таковой всего 1. Для поиска самых длинных белков был проведён анализ белков в диапазоне от 2000 (табл. 4). Всего таких белков оказалось 8, самые длиные из них имеют длину 6720 и 7461.
Было подтверждено повышенное содержание Гуанина и Цитозина в геноме Mycolicibacterium madagascariense (табл. 5), что отмечалось и в исследованиях Казда и др. 1992. Общее GC-содержание оказалось равно 69,5%.
Рассмотрим подробнее самый длинный и самый короткий белки (табл. 6). Проведя анализ белков было определено, что все они расположены в хромосоме. Из этой таблицы также видно, что среди них нет гипотетических белков, то есть их существование было доказано секвенированием in vivo.
Заметна интересная вещь – количество стоп-кодонов на порядок превосходит количество старт-кодонов: 19567 на 5601 соответственно (табл. 7 и 8). Это, скорее всего, свидетельствует о наличии специфических старт-кодонов у Mycolicibacterium madagascariense.