Получены общие сведения о протеоме бактерии путем анализа таблицы генов. Построены гистограммы длин белков, изучено распределение генов по прямой и обратным цепям ДНК, подсчитано число генов разных типов, найдены координаты открытых рамок считывания.
Nonlabens dokdonensis, proteome analysis, genome analysis, анализ генома, анализ протеома.
Фотогетеротрофная грамотрицательная Nonlabens dokdonensis относится к семейству Flavobacteriaceae отдела Bacteroidetes. Вид впервые выделен из вод Тихого океана и описан как Donghaeana dokdonensis в 2006 году [1], позднее перенесен в род Nonlabens [2]. На этом организме открыт класс родопсинов с NQ-мотивом [3].
Размер генома составляет приблизительно 3,9 млн пар нуклеотидов, он представлен одной кольцевой хромосомой.
В качестве исходных данных взяли аннотированный геном Nonlabens dokdonensis DSW-6 [4]. В работе применялось приложение для работы с электронными таблицами. Использовались функции ВПР (при составлении плоской таблицы), COUNTIFS (для определения количества генов на прямой и обратной цепи), BINOM.DIST (анализ случайности распределения генов по цепям ДНК). Таблицу с числом генов по классам создали при помощи опции “Сводная таблица”, а гистограмму - при помощи опции “Диаграммы”.
Для анализа нуклеотидного состава применялись программы из пакета EMBOSS wordcount (опция -wordsize, параметр 1) и geecee. Для поиска открытых рамок считывания использовали конвейер из getorf (-table 11 -find 3 -minsize 90 -circular) и grep (поиск по ">").
Длина генома составляет 3914632 п. н. Частота GC пар составляет 0,35. Количество нуклеотидов каждого типа представлено в таблице 1. Правило Чаргаффа выполняется.
В протеоме преодладают белки малых и средних размеров. Распределение длин белков отражено на рисунке 1. Исходные данные расположены на листе “11. Длины белков” таблицы 1 сопроводительных материалов.
Большая часть генома Nonlabens dokdonensis является кодирующей, причем частота GC пар ниже, чем АТ, что может свидетельствовать об относительно низкой температуре среды обитания бактерии. Число ORF в геноме сильно превышает число генов. Распределение генов по цепям ДНК неслучайно.
Белки в протеоме в основном малой и средней длины.
1. J.-H. Yoon, S.-J. Kang, C.-H. Lee and T.-K. Oh. Donghaeana dokdonensis gen. nov., sp. nov.,isolated from sea water. International Journal of Systematic and Evolutionary Microbiology. 2006; 56: 187–191
2. H. Yi, J. Chun Unification of the genera Nonlabens, Persicivirga, Sandarakinotalea and Stenothermobacter into a single emended genus, Nonlabens, and description of Nonlabens agnitus sp. nov. Systematic and Applied Microbiology. 2012; 35 (3): 150-155
3. S.-K. Kwon, B. K. Kim, J. Y. Song, M.-J. Kwak, C. H. Lee, J.-H. Yoon, T. K. Oh, J. F. Kim A. Genomic Makeup of the Marine Flavobacterium Nonlabens (Donghaeana) dokdonensis and Identification of a Novel Class of Rhodopsins. Genome Biology and Evolution. 2013; 5(1): 187–199
4. Директория с данными о геноме Nonlabens dokdonensis DSW-6 на сайте NCBI ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/332/115/GCF_000332115.1_ASM3 3211v1