Геномное окружение. База данных GO.

Получение информации о КОГе белка

Дальнейшая работа проводилась с белком ANW71083.1, доставшимся мне в 1 семестре. Белок является метионин-аденозил-трансферазой бактерии Neisseria meningitidis. Всего в нем 389 аминокислотных остатка.
С помощью сервиса CDD (Conserved Domain Database) для данного белка был получен список хитов (Рис. 1), из которого был выбран тот, который относит белок к КОГу. Было выяснено, что белок принадлежит к КОГу COG0192 'S-adenosylmethionine synthetase'(S-аденозилметионин-синтетаза) со значением E-Value 0e+00. КОГ обнаруживается с 1 по 379 а.о.
Найденный КОГ относится к категории "Coenzyme transport and metabolism", т.е. "Метаболизм и транспорт коферментов".

Рис. 1. Список хитов для белка ANW71083.1

Визуализация геномного окружения

Геномное окружение исследуемого белка было визуализировано с помощью базы данных COGNAT. О работе базы данных: Одна стрелочка = 1 ген. Показываются все гены, которые отнесены к выбранному КОГу в 711 прокариотических геномах (последний релиз базы данных, 2015 г.), и их геномное окружение. Neighborhood size – общее число генов, которые будут показаны, включая целевой ген (поровну слева и справа от целевого гена). Occurence threshold – если ген, продукт которого относится к какому-то КОГу, встречается в большем % случаев на рисунке, то все находки данного КОГа будут покрашены.
Мною были выбраны следующие параметры: Neighborhood size = 9, Occurence threshold = 10% (с начальными параметрами не представлялось возможным работать с геномным окружением), Таксономия НЕТ

Рис. 2. Геномное окружение COG0192.


Для определенных групп организмов характерно достаточно консервативное окружение, однако в целом окружение весьма вариабельное.
Часто мы можем наблюдать правее COG0192 ген COG1198 - Primosomal protein N' (replication factor Y) - superfamily II helicase, относящийся к функциональной категории Replication, recombination and repair.
Довольно часто встречается COG0499 - S-adenosylhomocysteine hydrolase, который относится к той же функциональной категории, что и COG0192, что говорит об их возможной функциональной связи.

Отнесение белка methionine adenosyltransferase из Neisseria meningitidis к терминам GO

С помощью инструмента AmiGO поиском BLAST в базе данных GO был обнаружен белок, наиболее похожий на ANW71083.1. Им оказалась S-аденозилметионин-синтетаза из организма Geobacter sulfurreducens PCA (Uniprot:P61946)(P-value = 2.3e-142). 'Мой' белок выполняет аналогичную функцию, но принадлежит другому организму - Neisseria meningitidis.

На странице белка P61946 по ссылке view associations была получена информация о терминах GO, отнесенных к данному белку. Их оказалось всего 3. Найденные термины представлены в таблице 1.

АспектИдентификатор GOНазвание терминаПеревод названия Код типа достоверности
Биологический процесс
(Biological process)
GO:0006555 Methionine metabolic processМетаболический процесс метионина ISS
Биологический процесс
(Biological process)
GO:0006556 S-adenosylmethionine biosynthetic process S-аденозилметионин-синтетазный процессISS
Молекулярная функция
(Molecular function)
GO:0004478 Methionine adenosyltransferase activity Метионин-аденозилтрансферазная активностьISS

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P61946.

Код типа достоверностиРасшифровка кода типа достоверностиОбъяснение
ISSInferred from Sequence or Structural SimilarityИспользуется, когда основой для аннотации служит анализируемые вручную последователльности; требует от кураторов создания стабильного идентификатора. Если значение With/From является геном или его продуктом, для него должны быть экспериментальные (или IC) доказательства.

Таблица 2. Описание кодов достоверности.


© Макиевская Кьяра, 2019