Мини-обзор генома Tatumella citrea.

Лияскина Ирина

МГУ, Факультет биоинженерии и биоинформатики, ул. Колмогорова, 1 строение 73, Москва, 119192

  1. Введение

  2. Tatumella citrea – грамотрицательная бактерия, по форме представляет собой короткие палочки до 3мм. Они образуют колонии от бледно-бежевых до бледно-оранжевых. Используют никотиновую кислоту и никотинамид для роста. Факультативные анаэробы. Содержание ДНК с гуаниновыми и цитозиновыми основаниями составляет 49,8 мол.%. Типовой штамм SHS 2003T был выделен из мандарина в Японии (Brady C.L. et al, 2010).

    Данную бактерию так же использовали при исследовании системы CRISPR-Cas9, при реализации точных модификаций генома, например, при делеции или вставке генов. У Tatumella citrea эффективность успешных целевых хромосомных делеций достигает 100% ( Zhang Y. Et al, 2020).

    Также Tatumella citrea является одним из преобладающих видов на стадии ферментации какао-бобов. Что было выявлено с помощью гена 16S рРНК-PCR-DGGE. Оказывается, контроль за ограничением разнообразия видов бактерий во время ферментации позволит производить высококачественное какао и шоколадные конфеты из них (Papalexandratou Z. et al, 2011).

  3. Матриалы и методы

  4. При исследовании использовалась последовательность генома GCF_002163605.1_ASM216360v1_genomic.fna и таблица особенностей GCF_002163605.1_ASM216360v1_feature_table.

    Расчеты проводились при помощи Excel, Python.

    Программа для подсчёта GC-состава(см. сопроводительные материалы).

    Критерий Пирсона рассчитывался по формуле:

    Критерий Пирсона формула Критерий Пирсона легенда

    Таблица критических точек.

  5. Результаты

  6. 3.1 Число и названия ДНК, составляющих геном Tatumella citrea. Состоит из одной хромосомы и одной плазмиды. С помощью программы на Python был рассчитан GC-состав. От родственных представителей GC-состав хромосом отличается незначительно. Например: P. punctata (LMG 22050T , LMG 22098), 50.7 mol%; P. terrea (LMG 22051T , LMG 23564), 52.6– 52.8 mol%; and T. ptyseos (LMG 7888T , LMG 23565), 51.7–52.1 mol%(Brady C.L. et al, 2010)(Таблица 1).

    Днк Длина п.н. GC-состав
    Хромосома 4543285 0,4911
    Плазмида 3834 0,3216

    Талица 1

    3.2 Статистические данные о белках

    3.2.1 С помощью Excel и таблицы особенностей генома была построена гистограмма длин белков(Диаграмма 1). Как видно, пик приходится на 450 аминокислотных остатков.

    Диаграмма 1. Распределние длин белков.

    3.2.2 Так же были рассчитаны некоторые параметры для данного распределения (Таблица 2).

    Средняя длина 319,14
    Стандарстное отклонение 197,4
    Медиана 288
    Минимальное значение 14
    Максимальное значнение 2810

    Талица 2

    3.3 Статистические данные о белках протеома.

    3.3.1 С помощью Excel и таблицы особенностей генома (см. сопроводительные материалы) были рассчитаны: общее количество генов, и распределения генов по цепям с помощью критерия Пирсона (см. методы и материалы) (Таблица 3).

    X^2=((1/2*8364-4241)^2)/4241+((1/2*8364-4121)^2)/4121=1,72

    При степени свободы 1 и уровне значимости 0,05 по таблице критических точек X^2: 3,8>1,72. Тогда можно сделать вывод о том, что гены распределены по цепям случайным образом.

    Количество Процентное содержание, %
    Всего генов 8364 100
    Генов на прямой цепи 4241 50,7
    Генов на обратной цепи 4121 49,3
    Число генов белков 4002 47,8 (от всех генов)

    Талица 3

    3.3.2 По данным таблицы особенностей бактерии, получилась Таблица 4. Гипотетических белков в процентном соотношении ко всем белкам получилось не так много(5,4%), что говорит о хорошей изученности генома Tatumella citrea.

    Количество Процентное содержание, %
    Всего генов 8364 100
    Гипотетические белки 215 5,4 от всех белков
    Транспортные белки 597 14,9 от всех белков

    Талица 4

    3.4 Статистические данные о генах РНК.

    Также с помощью таблицы особенностей Tatumella citrea, получила Таблицу 5. Недостающие RNA это, например : RNA pyrophosphohydrolase, RNA polymerase factor sigma-54 и RNA polymerase sigma factor RpoE и другие.

    Количество Процентное содержание, %
    Общее число генов рРНК-PCR-DGGE 135 1,6 от всех генов
    Рибосомальные РНК 32 23,7 от всех РНК
    Транспортные РНК 73 54,1 от всех РНК

    Талица 5

  7. Сопроводительные материалы

  8. /home/students/y22/liyaskina.irina/term1/miniobz/GCF_002163605.1_ASM216360v1_feature_table.txt - таблица особенностей.

    /home/students/y22/liyaskina.irina/term1/miniobz/GCF_002163605.1_ASM216360v1_genomic.fna - последовательность генома

    /home/students/y22/liyaskina.irina/term1/miniobz/ 'GC-состав для обзора.txt' - GC-состав, код на Python.

  9. Литература