Таксономия Pusillibacter faecalis[1]:
Надцарство: Bacteria
Царство: Bacillati
Тип: Bacillota
Класс: Clostridia
Отряд: Eubacteriales
Семейство: Oscillospiraceae
Род: Pusillibacter
Pusillibacter faecalis - грамотрицательная бактерия, палочка или палочковидная, культивируется на строго анаэробной среде с GAM агаром, колонии точечные или дисковидные, светло-серые полупрозрачные, не образуют на ней споры и неподвижны[2]. Данный вид бактерии был выделен из фекалий человека, больного раком желудка[3].
В таблице CDS from Pussilibacter faecalis (см. приложение 1) есть колонка Length, с помощью которой и функций Google sheets были подсчитаны длины белков, и для каждого диапазона с шагом 100 было подсчитано количество белков, длины которых лежат в данном диапазоне.
В таблице CDS from Pussilibacter faecalis (см. приложение 1) есть колонка %GC, для каждого диапазона с шагом 5, было подсчитано количество генов с %GC, которые лежат в данных диапазонах.
Для 3.3 был написан скрипт на bash (см. приложение 2) и возможности Google Sheets. Скрипт работает с файлом формата fasta, который вырезает по две строки после каждого названия гена для CDS, pseudo- и “нормальных” генов. Затем берет вторую строку и вырезает по три нуклеотида и строки, которые являются старт-кодоном.
Наибольшее количество белков у Pusillibacter faecalis с длиной 100-300 аминокислот (рис. 1). Из гистограммы видна зависимость, что количество более длинных белков после 100 аминокислот уменьшается.
На гистограмме (см. приложение 1, лист gc_hist) видно, что больше всего CDS с %GC в пределах от 50 до 65%, особенно 55-60%. Можно сказать, что гуанин и цитозин немного превалируют в составе генома бактерии. Возможно увеличение %GC может свидетельствовать о том, что бактерия живет в кишечнике человека, в котором среда более агрессивная, чем, например, в пресном водоеме.
CDS | NORMAL | pseudogene | |
ATG | 2930 | 2891 | 39 |
GTG | 252 | 252 | 0 |
TTG | 163 | 161 | 2 |
ATT | 8 | 6 | 2 |
CTG | 8 | 7 | 1 |
ATA | 4 | 4 | 0 |
ATC | 4 | 4 | 0 |
TCA | 3 | 0 | 3 |
TCT | 3 | 0 | 3 |
AAG | 1 | 0 | 1 |
AGA | 1 | 0 | 1 |
CGG | 1 | 1 | 0 |
GAG | 1 | 0 | 1 |
GGG | 1 | 0 | 1 |
GGT | 1 | 0 | 1 |
TCG | 1 | 0 | 1 |
TTT | 1 | 0 | 1 |
По таблице видно, что кроме ATG, превалируют старт-кодоны GTG и TTG в нормальных генах. ATG во всех CDS 86,6%, GTG - 7,4%, TTG - 4,8%. Стоит отметить, что у них отличается только первый нуклеотид. Если посмотреть на строение нуклеотидов аденина, тимина и гуанина, можно примерно сказать, что могло привести к их изменению. Старт-кодонов GTG больше, чем старт-кодонов с тимином, оно и логично - аденин и гуанин оба пуриновые основания, для изменения аденина в гуанин нужно меньше затрат энергии, хоть и скорее это изменение связано с мутацией. Больше интересно то, что тРНК считывает такой кодон как старт-кодон, даже если основания похожи, они не полностью совпадают, просто так тРНК не может считывать GTG, как ATG. С TTG ещё сложнее, тимин это нуклеотид с пиримидиновым основанием, оно вообще не похоже на аденин.
Как видно из таблицы (см. приложение 3) в основной хромосоме 16S, 5S и 23S rRNA сгруппированы в одном месте и на + цепи и на - цепи. Также в плазмиде pMM59_01 на - цепи эти три rRNA находятся очень близко, но на + цепи их нет. Сложно сказать, с чем это связано. tRNA гораздо больше (см. приложение 4), чем rRNA, и все tRNA находятся в разных местах хромосом от 1 до 9 генов. Некоторые гены tRNA находятся в нескольких местах, возможно потому, что один белок могут кодировать разные кодоны, для которых нужны разные антикодоны. Также есть два tRNA-OTHER, которые возможно либо неспецифичны, либо занимаются транспортом других молекул.
Хочу поблагодарить весь преподавательский состав за обучение методам, которые я применил в написание этого мини обзора и моего однокурсника Антона Куликова за помощь с генерацией идеи для пункта в мини обзоре.