Геномная сборка моей бактреии Defluviicoccus vanus из базы данных RefSeq имеет идентиификатор: GCF_014672695.1. С помощью этого идентификатора получилось найти страницу из базы NCBI Datasets Genome, которая соответсвует этой сборке. Затем удалось узнать идентификатор последней версии сборки INSDC: GCA_014672695.1.
Узнав идентификатор в INSDC, я нашёл протеом своей бактерии в UniProt Proteomes, используя поисковой запрос: GCA_014672695.1. Данный запрос выдал 1 результат, протеом, в котором 3 383 бека, с идентификатором: UP000516369, который является референсным.
Найденный протеом является референсным и является непосредственно протеомом моей бактерии. Чтобы скачать все белковые записи из этого протеома я применил команду:
Для оценки количества ферментов в протеоме я использовал поисковой запрос (proteome:UP000516369) AND ((protein_name:enzyme) OR (ec:*) OR (cc_catalytic_activity:*)) в UniProtKB. Всего из 3 383 белков, 680 были результатом данного запроса.
Также для оценки количества ферментов был применён конвейер bash:
Данный ковейер на выходе выдаёт 652 результата, что немного меньше чем в UniProt. Поиск производился по наличию кода EC в поле DE.
Небольшое рассхождение может быть связано с тем, что не у всех ферментов был указан код EC, а также с тем, что в UniProt могли были быть найдены белки, котрые могут катализировать некоторые реакции, но их основная функция другая и ферментами их называть не совсем верно.
Так как исследуемая мною ранее бактерия может обитать в очистных сооружениях сточных вод, то я решил посмотреть на среднее значение изоэлектрической точки всех белков. Для этого я использовал следующий конвейер в bash, используя в том числе команды из EMBOSS:
В результате я получил среднее значение pH равное 7.20896. Это значение близко к нейтральному значению pH, что может говорить о том, что бактерия не находится под сильным влиянием фактора кислотности среды. Кроме того это также может свидетельствовать об адаптированности к широкому диапозону условий.
Тем не менее данный результат не может свидетельствовать об отсутствии вариабельности белков. Если немного упростить конвейер, то можно посмотреть сколько белков имеют те или инные значения изоэлектрической точки:
Слишком сильные отклонения от средних значений (pH = 1; 2 или pH = 13; 14) могут иметь неоднозначный смысл. Такие белки могут являться как и приобретёнными этой бактерией горизонтальным переносом, так и являться ключевыми для существования бактерии.
Я считаю, что данная бактерия не обитает в агрессивных условиях с точки зрения кислотности среды, а также имеет довольно универсальный набор белков, адаптированных под изменения окружающих условий.