На главную


Геномное окружение. База данных GO

1. Определение COG ID белка ANE87960.1

Для определения COG ID белка ANE87960.1 использовался сервис CDD. Указанный белок относится к COG4912, аннотированный как 3-метиладенин ДНК гликозилазе AlkD (3-methyladenine DNA glycosylase AlkD). Указанный COG относится к функциональной категории L (репликация, рекомбинация и репарация, Replication, recombination and repair). E-value указанной находки составляет 2.36e-37, указанный COG обнаруживается с 21 по 222 а.о. белка (общая длина белка составляет 237 а.о.).

2. Визуализация геномного окружения

Геномное окружение COG4912 было получено с помощью сервиса COGNAT [1]. При установке параметра Occurence threshold = 10% никакие гены, кроме искомого, не оказались покрашенными (то есть не нашлось генов, с частотой встречаемости больше 10%). Поэтому порог был понижен до 1%. Результат поиска представлен на рисунке 1 (ссылка, описание: Геномное окружение COG4912, полученное с помощью COGNAT (Occurence threshold = 1%, Neighborhood size = 15, Taxonomy = "ДА"). 1 стрелочка соответствует 1-ому COG. Окрашенные cтрелочки обозначают COG, встречающиеся более, чем в 1% находок. Ярко-фиолетовой стрелочкой покрашен искомый COG). Геномное окружение COG4912 сложно назвать консервативным во всех наблюдаемых случаях. Однако можно выделить несколько интересных наблюдений:
1. COG5002 Signal transduction histidine kinase (светло-розовая стрелочка). Этот COG был найден в 17 бактериях, расположение его относительно COG4912 вариабельно (выше/ниже по цепи и дальность расположения).
2. COG2896 Molybdenum cofactor biosynthesis enzyme MoaA (темно-зеленая стрелочка, обведено синим кружочком). У 5 организмов (NC_008686 NC_009952 NC_003911 NC_023135 NC_013131 ), относящихся к Rhodobacteraceae (грам-отрицательные хемосинтезирующие бактерии). Эта группа белков осуществляет начальную стадию синтеза молибден-содержащего кофактора. Этот кофактор синтезируется почти во всех организмах, однако у представителей этого таксона ген синтеза первого фермента этого пути расположен сразу после COG4912. На рисунке 2 представлена схема биосинтеза этого кофактора. Видно, что эта группа белков работает с нуклеотидом, также как и COG4912.
Рисунок 2. Схема биосинтеза Molybdenum cofactor [2]

3. COG2226 Ubiquinone/menaquinone biosynthesis C-methylase UbiE (светло-салатовая стрелочка, обведено желтым кружочком). Это вторая по встречаемости группа белков, содержащаяся у 15 организмов. Мне показалось интересным расположение этого гена у организма NC_015510 Haliscomenobacter hydrossis DSM1100: этот ген "обрамляет" с двух сторон COG4912. Этот белок участвует в 2-х этапах биосинтеза убихинона и работает с S-аденозил-L-метионином [3].
Таким образом можно заметить, что все три вышеназванных группы белков, ассоциированные с COG4912, функционально связаны с нуклеиновыми кислотами (используют их в качестве субстрата для осуществляемых реакций).

3. Отнесение вашего белка к ANE87960.1 из организма Bacillus cereus к терминам GO

Для отнесения ANE87960.1 к терминам GO был использован сервис AMIGO. С помощью Blast были найдены гомологи ANE87960.1. Порог для e-value был выбран стандартный: 0,01. Было найдено 4 находки, все их которых неаннотированы по своим функциям (Uncharacterized protein), поэтому для дальнейшей работы был выбран белок GBAA_5145 из организма Bacillus anthracis, имеющий лучший e-value:4.0e-122. Этот белок является полностью идентичным исходному по аминокислотной последовательности. Информация о выбранном белке привдена в таблице 1. Расшифровка код ов типа достоверности приведена в таблице 2. Ссылка на страницу выбранного белка в AMIGO. Из таблиц видно, что сведений, позволяющих проаннотировать функции указанного белка, не было найдено.
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q81XT5_BACAN
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (biological_process) GO:0008150 Unknown GO term Неизвестно что ND
Клеточный компартмент (cellular_component) GO:0005575 Unknown GO term Неизвестно что ND
Функция на молекулярном уровне (molecular_function) GO:0003674 Unknown GO term Неизвестно что ND

Таблица 2. Описание кодов достоверности, использованных в Таблице 1
Код типа достоверности Расшифровка кода типа достоверности Объяснение
ND No biological Data availableЭтот код присваивается в случае, если куратор искал, но не нашел информации,
которая помогла бы проаннотировать этот белок по категориям:Molecular Function, Biological Process или Cellular Component.

4. Источники


[1] Klimchuk O.I. et al. COGNAT: a web server for comparative analysis of genomic neighborhoods // Biol. Direct. 2017. Vol. 12, № 1. P. 26.
[2] https://sites.duke.edu/yokoyamalab/research/cofactor-biosynthesis/
[3] http://www.uniprot.org/uniprot/A6TGL3