Геномное окружение. База данных GO.

Задание 1. Получение информации о КОГе, к которому относится белок.

ID белка: P0A720 (KTHY_ECOLI)

thymidylate kinase

COG: COG0125

E-value 1.36e-83

Интервал КОГа 1-210, длина 213aa

Thymidylate kinase [Nucleotide transport and metabolism]

Тимидилаткиназа [транспорт и метаболизм нуклеотидов]

Функциональная категория: F

Задание 2. Визуализация геномного окружения

Геномное окружение COG0125 было получено с помощью сервера COGNAT со следующими параметрами: Neighborhood Size: 9 (по умолчанию), Occurrence Threshold (%): 10, с указанием таксономии. Гены изображаются на схеме в виде стрелочек, на картинке ниже указано, к каким генам относятся стрелочки разных цветов.


Ниже приведена части выдачи, откуда видно, что геномное окружение кога является довольно консервативным для определенных групп организмов. Данный ген окружают COG0115 (аминотрансфераза), COG1559 (белок клеточной деления YceG) с одной стороны, с другой стороны - COG2812 или COG0470 ДНК полимеразы III (разные сабюниты), COG0084 белка TatD (ДНКазная активность). Функция рассматриваемого белка - это фосфорилирование нуклеотидов, поэтому вполне возможно, что он может быть функционално связан с ДНК-полимеразой III.



Если посмотреть на остальную часть списка из выдачи, то консервативного геномного окружения для данного кога не наблюдается. Гены в окружении расположены в разном порядке, в их расположении нет закономерности, могут быть по-разному сориентированы по отношению к данному белку.

Полное изображение можно увидеть, перейдя по ссылке.

Задание 3. Отнесение белка тимидилаткиназы из E.coli к терминам GO

Для белка с лучшей находкой p-value составил 2.4e-108, этот белок тоже из E.coli, совпадение равно 100%, то есть это тот же самый белок.

Для этого белка были опредены термины GO (табл. 1).

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P0A720 (KTHY_ECOLI)

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (biological process) GO:0006233 dTDP biosynthetic process биосинтез дТДФ IDA
Биологический процесс (biological process) GO:0046939 nucleotide phosphorylation фосфорилирование нуклеотидов IBA
Молекулярная функция (molecular function) GO:0004798 thymidylate kinase activity тимидилаткиназная активность IDA
Молекулярная функция (molecular function) GO:0005737 cytoplasm цитоплазма IDA

Таблица 2. Описание кодов достоверности, использованных в Таблице 1

Код типа достоверности Расшифровка кода типа достоверности Объяснение
IDA Inferred from Direct Assay Используется, когда информация о гене получена прямо из эксперимента, основанного на методе молекулярной биологии.
IBA Inferred from Biological aspect of Ancestor Тип филогенетического доказательства, согласно которому аспект потомка выводится посредством характеристики аспекта наследственного гена.

© Anastasiya Nefedova, 2017