Получены общие сведения о протеоме бактерии путем анализа таблицы генов. Построены гистограммы длин белков, изучено распределение генов по прямой и обратным цепям ДНК, подсчитано число генов разных типов, найдены координаты открытых рамок считывания.
Nonlabens dokdonensis, proteome analysis, genome analysis, анализ генома, анализ протеома.
Фотогетеротрофная грамотрицательная Nonlabens dokdonensis относится к семейству Flavobacteriaceae отдела Bacteroidetes. Вид впервые выделен из вод Тихого океана и описан как Donghaeana dokdonensis в 2006 году [1], позднее перенесен в род Nonlabens [2]. На этом организме открыт класс родопсинов с NQ-мотивом [3].
Размер генома составляет приблизительно 3,9 млн пар нуклеотидов, он представлен одной кольцевой хромосомой.
В качестве исходных данных взяли аннотированный геном Nonlabens dokdonensis DSW-6 [4]. В работе применялось приложение для работы с электронными таблицами. Использовались функции ВПР (при составлении плоской таблицы), COUNTIFS (для определения количества генов на прямой и обратной цепи), BINOM.DIST (анализ случайности распределения генов по цепям ДНК). Таблицу с числом генов по классам создали при помощи опции “Сводная таблица”, а гистограмму - при помощи опции “Диаграммы”.
Для анализа нуклеотидного состава применялись программы из пакета EMBOSS wordcount (опция -wordsize, параметр 1) и geecee. Для поиска открытых рамок считывания использовали конвейер из getorf (-table 11 -find 3 -minsize 90 -circular) и grep (поиск по ">").
Длина генома составляет 3914632 п. н. Частота GC пар составляет 0,35. Количество нуклеотидов каждого типа представлено в таблице 1. Правило Чаргаффа выполняется.
таблица 1
Таблица 2. Расположение генов разных
типов по цепям ДНК.
В протеоме преодладают белки малых и средних размеров. Распределение длин белков отражено на рисунке 1. Исходные данные расположены на листе “11. Длины белков” таблицы 1 сопроводительных материалов.
Рис. 1. Зависимость числа белков от их
длины в протеоме, не показан один
белок длины 9582 п. н.
Большая часть генома Nonlabens dokdonensis является кодирующей, причем частота GC пар ниже, чем АТ, что может свидетельствовать об относительно низкой температуре среды обитания бактерии. Число ORF в геноме сильно превышает число генов. Распределение генов по цепям ДНК неслучайно.
Белки в протеоме в основном малой и средней длины.
1. J.-H. Yoon, S.-J. Kang, C.-H. Lee and T.-K. Oh. Donghaeana dokdonensis gen. nov., sp. nov.,isolated from sea water. International Journal of Systematic and Evolutionary Microbiology. 2006; 56: 187–191
2. H. Yi, J. Chun Unification of the genera Nonlabens, Persicivirga, Sandarakinotalea and Stenothermobacter into a single emended genus, Nonlabens, and description of Nonlabens agnitus sp. nov. Systematic and Applied Microbiology. 2012; 35 (3): 150-155
3. S.-K. Kwon, B. K. Kim, J. Y. Song, M.-J. Kwak, C. H. Lee, J.-H. Yoon, T. K. Oh, J. F. Kim A. Genomic Makeup of the Marine Flavobacterium Nonlabens (Donghaeana) dokdonensis and Identification of a Novel Class of Rhodopsins. Genome Biology and Evolution. 2013; 5(1): 187–199
4. Директория с данными о геноме Nonlabens dokdonensis DSW-6 на сайте NCBI ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/332/115/GCF_000332115.1_ASM3 3211v1