Лияскина Ирина
МГУ, Факультет биоинженерии и биоинформатики, ул. Колмогорова, 1 строение 73, Москва, 119192
Tatumella citrea – грамотрицательная бактерия, по форме представляет собой короткие палочки до 3мм. Они образуют колонии от бледно-бежевых до бледно-оранжевых. Используют никотиновую кислоту и никотинамид для роста. Факультативные анаэробы. Содержание ДНК с гуаниновыми и цитозиновыми основаниями составляет 49,8 мол.%. Типовой штамм SHS 2003T был выделен из мандарина в Японии (Brady C.L. et al, 2010).
Данную бактерию так же использовали при исследовании системы CRISPR-Cas9, при реализации точных модификаций генома, например, при делеции или вставке генов. У Tatumella citrea эффективность успешных целевых хромосомных делеций достигает 100% ( Zhang Y. Et al, 2020).
Также Tatumella citrea является одним из преобладающих видов на стадии ферментации какао-бобов. Что было выявлено с помощью гена 16S рРНК-PCR-DGGE. Оказывается, контроль за ограничением разнообразия видов бактерий во время ферментации позволит производить высококачественное какао и шоколадные конфеты из них (Papalexandratou Z. et al, 2011).
При исследовании использовалась последовательность генома GCF_002163605.1_ASM216360v1_genomic.fna и таблица особенностей GCF_002163605.1_ASM216360v1_feature_table.
Расчеты проводились при помощи Excel, Python.
Программа для подсчёта GC-состава(см. сопроводительные материалы).
Критерий Пирсона рассчитывался по формуле:
Таблица критических точек.
3.1 Число и названия ДНК, составляющих геном Tatumella citrea. Состоит из одной хромосомы и одной плазмиды. С помощью программы на Python был рассчитан GC-состав. От родственных представителей GC-состав хромосом отличается незначительно. Например: P. punctata (LMG 22050T , LMG 22098), 50.7 mol%; P. terrea (LMG 22051T , LMG 23564), 52.6– 52.8 mol%; and T. ptyseos (LMG 7888T , LMG 23565), 51.7–52.1 mol%(Brady C.L. et al, 2010)(Таблица 1).
Днк | Длина п.н. | GC-состав |
---|---|---|
Хромосома | 4543285 | 0,4911 |
Плазмида | 3834 | 0,3216 |
Талица 1
3.2 Статистические данные о белках
3.2.1 С помощью Excel и таблицы особенностей генома была построена гистограмма длин белков(Диаграмма 1). Как видно, пик приходится на 450 аминокислотных остатков.
Диаграмма 1. Распределние длин белков.
3.2.2 Так же были рассчитаны некоторые параметры для данного распределения (Таблица 2).
Средняя длина | 319,14 |
---|---|
Стандарстное отклонение | 197,4 |
Медиана | 288 |
Минимальное значение | 14 |
Максимальное значнение | 2810 |
Талица 2
3.3 Статистические данные о белках протеома.
3.3.1 С помощью Excel и таблицы особенностей генома (см. сопроводительные материалы) были рассчитаны: общее количество генов, и распределения генов по цепям с помощью критерия Пирсона (см. методы и материалы) (Таблица 3).
X^2=((1/2*8364-4241)^2)/4241+((1/2*8364-4121)^2)/4121=1,72
При степени свободы 1 и уровне значимости 0,05 по таблице критических точек X^2: 3,8>1,72. Тогда можно сделать вывод о том, что гены распределены по цепям случайным образом.
Количество | Процентное содержание, % | |
---|---|---|
Всего генов | 8364 | 100 |
Генов на прямой цепи | 4241 | 50,7 |
Генов на обратной цепи | 4121 | 49,3 |
Число генов белков | 4002 | 47,8 (от всех генов) |
Талица 3
3.3.2 По данным таблицы особенностей бактерии, получилась Таблица 4. Гипотетических белков в процентном соотношении ко всем белкам получилось не так много(5,4%), что говорит о хорошей изученности генома Tatumella citrea.
Количество | Процентное содержание, % | |
---|---|---|
Всего генов | 8364 | 100 |
Гипотетические белки | 215 | 5,4 от всех белков |
Транспортные белки | 597 | 14,9 от всех белков |
Талица 4
3.4 Статистические данные о генах РНК.
Также с помощью таблицы особенностей Tatumella citrea, получила Таблицу 5. Недостающие RNA это, например : RNA pyrophosphohydrolase, RNA polymerase factor sigma-54 и RNA polymerase sigma factor RpoE и другие.
Количество | Процентное содержание, % | |
---|---|---|
Общее число генов рРНК-PCR-DGGE | 135 | 1,6 от всех генов |
Рибосомальные РНК | 32 | 23,7 от всех РНК |
Транспортные РНК | 73 | 54,1 от всех РНК |
Талица 5
/home/students/y22/liyaskina.irina/term1/miniobz/GCF_002163605.1_ASM216360v1_feature_table.txt - таблица особенностей.
/home/students/y22/liyaskina.irina/term1/miniobz/GCF_002163605.1_ASM216360v1_genomic.fna - последовательность генома
/home/students/y22/liyaskina.irina/term1/miniobz/ 'GC-состав для обзора.txt' - GC-состав, код на Python.