Данная статья представляет собой результаты практики в применении различных методов анализа генома на примере бактерии Chloracidobacterium thermophilum B, на основе которых были сделаны выводы о биологических особенностях орагнизма.
Chloracidobacterium thermophilum B. - грам-отрицательная бактерия-экстремофил, была обнаружена во время секвенирования метагенома биоплёнки в кремнистых горячих источниках Йеллоустонского национального парка, США.[1] Таксономическое положение бактерии приведено в таблице 1.
Chloracidobacterium thermophilum способна к фотосинтезу, осуществляемый через гомодимерический реакционный центр типа-1[2], который обычно ассоциируется с анаэробными бактериями, но Chloracidobacterium thermophilum B. относится к микроаэрофилам[3] (небольшое количество кислорода необходимо для функционирования бактерии), что поднимает вопросы о механизме возникновения у бактерии фотосинтетических свойств.
Геном Chloracidobacterium thermophilum B. был получен из базы данных National Center for Biotechnology Information (NCBI), США.[S1]
Для анализа использовались инструменты Google Sheets (фильтры и функции), Bash и Python.
| Домен | Bacteria |
| Царство | Pseudomonadati |
| Тип | Acidobacteriota |
| Класс | Terriglobia |
| Порядок | Terriglobales |
| Семейство | Acidobacteriaceae |
| Род | Chloracidobacterium |
| Вид | Chloracidobacterium thermophilum |
Таблица 1. Систематическое положение Chloracidobacterium thermophilum B.[4]
Для анализа длин белков использовались данные из обзорной таблица генома “feature_table.txt”. Данные были переведены в формат Google Tables, и были изолированы участки, кодирующие белки, с помощью фильтра и затем проанализированы их длины через функцию COUNTIFS, с помощью которой было подсчитано количество белков длиной в диапазоне разницей в 40 аминокислот.[S2]
Для определения количества репликонов и их состава также были использованы данные “feature_table.txt”. Данные сначала были занесены в Google Tables, затем выделены кодирующие последовательности через фильтр. Количества закодированных белков и различных типов РНК были посчитано через функцию COUNTIF у каждого репликона.[S3]
Для определения генов, которые участвуют в фотосинтезе у бактерий, сначала был выделен список белков и соответствующих генов Chloracidobacterium thermophilum B. из таблицы “translated_cds.faa” с помощью командной строки bash.
Файл translated_cdsEDITED.faa вставили в таблицу [S4] как страницу “1.Pure Table”, однако представленные данные были неупорядочены. С помощью фильтров и ручного редактирования страницы мы подставили значения в соответствующие столбцы, получив страницу с понятными данными “2. Edited”. Затем, с помощью фильтра были выделены белки, ассоциированные с конкретными генами в страницу “3.Gene-Associated”.
Получив таблицу с геномом Chloracidobacterium thermophilum B., мы сравнили их со списком генов, необходимых для фотоавтотрофного питания у различных цианобактерий (было проанализировано множество видов), взятых из таблицы другого исследования: S3[5]. Для этого таблица была скопирована в текстовый документ “genesCiano”, из которого с помощью команды bash мы выделили только столбец с генами.
Далее геном Chloracidobacterium thermophilum B. был скопирован в текстовый документ “genesCloracida”. Для устранения ненужных символов был использован скрипт GeneEdit.py[S5].
Затем мы сравнили геном Chloracidobacterium thermophilum B. и гены цианобактерий с помощью скрипта GeneComprare.py[S5], результаты работы которого были записаны на страницу “4. Comparison With Acidobacteria”[S4]
В ходе анализа генома Chloracidobacterium thermophilum B. была составлена гистограмма длины белков (рис.1).
Судя по гистограмме, наиболее часто встречающаяся длина белков находится в диапазоне 40-590 а.к., а длины белков >40 или <740 встречаются гораздо меньше. После значения 40 а.к. происходит резкий скачок в количестве белков, который достигает пика в 240-340 а.к. и затем количество плавно спадает.
Можно предположить, что белки длиной 40-590 а.к. выполлняют основную работу по поддержании жизнеделятельности клетки, тогда как остальные могут выполнять специфические функции и вследствие, часто не используются.

Chloracidobacterium thermophilum B. содержит только 2 репликона (далее реп.) в своём геноме, что делает её простой для анализа репликонного состава.
Судя по полученным результатам, реп. 1 имеет более разнообразный состав чем реп. 2: содержит в себе приблизительно в 2,8 раза больше белков и в 11 раз больше тРНК, чем реп. 2;
реп. 1 включает в себя такие виды РНК, как: SPR РНК, рРНК и тмРНК, в то время как данные типы рНК отсутствуют в реп. 2. Это явно свидетельствует, что реп.1 больше участвует в синтезе всех типов РНК, чем реп. 2.
Можно предположить, что реп. 1 служит носителям основной информации, необходимой для жизнедеятельности бактерии. В то время как реп. 2, может нести гены, приобретенные в результате параллельного переноса (как плазмида, накапливающая в себе гены в ходе развития Chloracidobacterium thermophilum B.), что объясняет её отдельное существование от реп. 1.
Таблица 2. Состав репликона 1 Chloracidobacterium thermophilum B.
| Число белков | Число SRP РНК | Число рРНК | Число тРНК | Число тмРНК |
|---|---|---|---|---|
| 2206 | 2 | 3 | 44 | 1 |
Таблица 3. Состав репликона 2 Chloracidobacterium thermophilum B.
| Число белков | Число SRP РНК | Число рРНК | Число тРНК | Число тмРНК |
|---|---|---|---|---|
| 790 | 0 | 0 | 4 | 0 |
В итоге из 60 генов, необходимых для фотосинтеза у цианобактерий, Chloracidobacterium thermophilum B., содержит только 23. Однако нельзя сказать, что это связано с более простым фотосинтетическим механизмом, так как Chloracidobacterium thermophilum B. содержит гены, которые не участвуют в фотосинтезе у большинства цианобактерий, однако необходимы для фотосинтеза у Chloracidobacterium thermophilum B. (такие как bchG, bchL, bchF, bchU, bchE, участвующие в синтезе бактериохлорофиллов.[6]).
В купе с осуществлением фотосинтеза через путь, обычно ассоциируемым с анаэробными бактериями, это может свидетельствовать о совмещении механизмов анаэробного и аэробного фотосинтеза в Chloracidobacterium thermophilum B., как механизм к приспособлению в жизни в горячих источниках, где доступ к кислороду затруднен из-за большой влажности и температуры, которые рассеивают молекулы O2
В то же время, был разработан метод для сравнения различных генотипов по наличию общих генов, который может быть использован в дальнейших исследованиях.
Таблица 4. Количество генов Chloracidobacterium thermophilum B., ассоциированных с фотосинтезом и присутствующих в геноме цианобактерий.
| Присутствуют | Отсутствуют |
|---|---|
| 23 | 37 |
1S. База данных, с генетической информацией Chloracidobacterium thermophilum B.
2S. Таблица белков; Стр. 3 “prot_lengths_hist” - Вычисление длин белков.
3S. Таблица геномов; Стр. 5 “per-replicones” - Определение репликонного состава.
S4. Таблица белков и ассоциированных генов.
S5. Список скриптов, написанных для работы.