Геномное окружение. База данных GO

Для работы была выбрана a-субъединица молибден-железного белка нитрогеназы из Herbaspirillum rubrisubalbicans M1, описанная в первом семестре. С помощью сервиса Conserved Domain Database (CDD) был найден кластер ортологичных генов (COG), который включает расматриваемый белок.

Name Accession Description Interval E-value
NifD COG2710 Nitrogenase molybdenum-iron protein, a and b chains [Inorganic ion transport and metabolism] 25-483 1.25e-143

Полное название COG - альфа и бета-цепи молибден-железного белка нитрогеназы (Nitrogenase molybdenum-iron protein, alpha and beta chain). COG относится к функциональной категории транспорта и метаболизма неорганических ионов (Inorganic ion transport and metabolism). При длине белка в 484аа, COG приходится на осатки 25-483. Покрытие составляет 94,8%.

Визуализация геномного окружения

С помощью COGNAT было получено изображение геномного окружения выбранного COG. Параметры запуска: COG: COG2710, Neighborhood Size: 9, Occurrence Threshold: 20%, Taxonomy: Нет.

Рисунок 1. Геномное окружение COG2710

Отнесение молибден-железного белка нитрогеназы из Herbaspirillum rubrisubalbicans M1 к терминам GO

С помощью опции поиска BLAST инструмента AMIGO был произведен поиск гомологов нашего белка. Им оказался nitrogenase molybdenum-iron protein, alpha chain из Geobacter sulfurreducens PCA. Функционально белки можно считать одним и тем же. P-value находки составило 5.0e-170. В таблице 1 представлены результаты отнесения белка ALU89561.1 к терминам GO.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P77874 (NIFD_HERSE)

Аспект Идентификатор GO Название термина Перевод названия термина Перевод названия термина
biological process GO:0009399 nitrogen fixation Фиксация азота ISS
cellular component GO:0016612 molybdenum-iron nitrogenase complex Молибден-железный комплекс нитрогеназы ISS
molecular function GO:0016163 nitrogenase activity Нитрогеназная активность ISS

Таблица 2. Описание кодов достоверности, использованных в Таблице 1

Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Присваивается, когда компьютерный анализ последовательности или структуры для аннотации был проведен вручную. Также для присвоения ISS анализ должен проводиться с использованием нескольких программ или методов. При невыполнении одного из условий используют одну из подкатегорий ISS.

В данном практикуме был определен кластер ортологичных генов, к которому относится белок ALU89561.1. Были найдены входящие в выбранный COG гены и их геномное окружение в разных прокариотических геномах. Для наиболее похожего на наш белок из базы GO были получены термины GO. Термины можно найти в таблице 1, описание единственного кода типа достоверности, встретившегося в первой таблице - в таблице 2.