В базе данных UniProt зарегестированно 3045 различных белков, относящихся к Chloracidobacterium thermophilum B., 14 из которых имеют ранг аннотаии (annotation score) "4/5", из которых будет проводиться выбор.
Далее выборка была уменьшена до белков относительно небольшой длинны (201-400 а.к.).
В итоге, для обзора был выбран белок G2LJA.
G2LJA6 относится к рибозо-фосфат-пирокиназам.
Учавствует в биосинтезе главного метаболита - фосфо-альфа-D-рибозил-1-пирофосфата (PRPP), с помощью переноса пирофосфорильной группы от АТФ к 1-ой гидроксогруппе рибозы-5-фосфата (Rib-5-P).
Длина - 309 а.к.

Рис. 1
Структура G2LJA, предсказанная с помощью AlphaFold.
По полученным данным можно сказать, белок достаточно консервативен, так как, согласно UniRef50, кластер с со схожестью меньше 50% уже нельзя отнести к G2LJA6.
Таблица 1.Сравнение размеров кластеров похожих белков.
| UniRef100_G2LJA6 | UniRef90_G2LJA6 | UniRef50_P14193 |
|---|---|---|
| 1 | 9 | 3406 |
Цель: Определить, насколько консервативна структура рибозо-фосфат-пирокиназ.
Запрос: (protein_name:"Ribose-phosphate pyrophosphokinase") NOT (taxonomy_id:981222)
Количество результатов: 30,135
Выввод: Сравнивая с количеством членов кластера UniRef50_P14193, выходит соотношение ~8,5:1, что может свидетельствовать о большом разнообразии структуры рибозо-фосфат-пирокиназ, не смотря на схожую функцию, так как количество белков, хотя бы на 50% схожих с G2LJA6 сравнительно мало с общим числом рибозо-фосфат-пирокиназ.
Цель: Определить число вирусных белков в Chloracidobacterium thermophilum
Запрос: (taxonomy_id:981222) AND (taxonomy_id:10239)
Количество результатов: 0
Выввод: Результат был отрицателным, что может свидетельствовать либо об отсутствии белков в Chloracidobacterium thermophilum, ассоциированных с вирусами (приобретённых в ходе переноса от вируса).
Цель: Определить число белков, совпадающих с цианобактериями, в продолжении индивидуального задания mini-review.
+ Гипотеза: Число будет не нулевым, т.к. имеются совпадающие гены.
Запрос: (taxonomy_id:981222) AND (taxonomy_id:1117)
Количество результатов: 0
Выввод: Результаты по UniProt несоответствуют гипотезе, что может свидетельствовать о разных механизмах процессинга белка, что, не смотрня на идентичную первичную структуру, приводит выходу разных молекул относительно вторичной+ структур. Либо, белки от общих генов не экспрессируются, существя в составе гетерохроматина.