Геномное окружение. База данных GO

Белок: 1,4-alpha-glucan-branching enzyme [Hungateiclostridium thermocellum AD2] Идентификатор белка: ALX09866.1
Последовательность белка в FASTA-формате:

>ALX09866.1 1,4-alpha-glucan-branching enzyme [Hungateiclostridium thermocellum AD2]
MNTTANIDEVYKVINAEHHDPFSVLGMHRLESENAMVVRAYLPNAKEIEVVELSKNNTYPMEKIDERGFF
EVVIKDRNDFFKYNLRATDYVGNTFTFYDPYCFMPVISDYDLYLFNEGNHHKIYEKLGTHRMTIDGVEGT
LFAVWAPCAKRVSVVGNFNQWDGRRHQMRVRGSSGVWELFIPGVGEGELYKYEIKTPHNEIYIKADPYAF
YSELRPNTASIVYDIEGYEWHDADWMRERDSSNSFDKPISIYEVHLGSWKRVSNDENGFYSYRELADMLV
EYVKYMGYTHIELLPIAEHPFDGSWGYQVTGYYAATSRYGQPKDFMYFVDKCHQNGIGVIIDWVPAHFPK
DGHGLARFDGTALYEHYDPKQGEHPDWGTHIFNYGRNEVKNFLIANAMFWFDKYHIDGLRVDAVASMLYL
DYGKKDGEWIPNRWGGKENVDAIEFMRQLNSTVFQYFPGVMMIAEESTAWALVTKPPYTGGLGFSYKWNM
GWMNDFLRYMSMDSVYRKYHQNLITFSLMYAFSENFILVLSHDEVVHGKCSMINKMPGDYWQKFAGLRAS
YGYLYGHPGKKLLFMGGEFAQFIEWNYKQSLDWFLLDYDMHKKMQDYVRDLNKLYRSEKALYEVDFHYDG
FEWIDCNDTEHSIISFMRKGKDWHNSLIFVCNFTPVPHEDYRIGSPFNTTYDEIFNSDWEKYGGSNVGNF
EPIKAEEISMHNKPYSMRLRIPPLATIVLKPRFDRKD

COG: Carbohydrate transport and metabolism (Карбогидратный транспорт и метаболизм)
Функциональная категория: G
COG ID: COG0296
E-value threshold: 0e+00
Interval (с какого по какой остаток вашего белка в нем обнаруживается COG) 103-731 (всего 733 аминокислотных остатков)

Визуализация геномного окружения

Search for COG or Pfam Identifier: COG0296

Параметры: Neighborhood Size: 9; Occurrence Threshold (%): 20; Taxonomy: Да

  • Neighborhood size – общее число генов, которые будут показаны, включая целевой ген (поровну слева и справа от целевого гена).

  • Occurence threshold – если ген, продукт которого относится к какому-то КОГу, встречается в большем % случаев на рисунке, то все находки данного КОГа будут покрашены. Например, 1% покрасит очень много стрелочек-генов, а 100%, скорее всего, вообще ни одной.

  • Taxonomy – по умолчанию (значение "НЕТ") геномные окружения будут отсортированы в соответствии с множественным выравниванием целевого КОГа (т.е. условно - по филогенетическому дереву данного КОГа). Значение "ДА" меняет сортировку на сортировку по таксономическому дереву организмов.

  • Download PDF – сохраняет рисунок в формате pdf. Проверьте, что браузер не блокирует всплывающие окна.

In [1]:
from IPython.display import Image
Image(filename='cognat.png')
Out[1]:
In [2]:
Image(filename='cc.jpg')
Out[2]:

В окружении часо встречается COG1523б; реже COG0366, COG0448, COG0297. Видны как участки высокой консервативности, так и совсем слабой.

Отнесение 1,4-alpha-glucan-branching enzyme из Hungateiclostridium thermocellum AD2 к терминам GO

P-value наилучшей находки: 3.0e-204
Организм: Shewanella oneidensis MR-1
Функции те же самые

Uniprot:Q8EGU7

Таблица 1. Термины GO, отнесенные к белку с идентификатором UniProt Q8EGU7 (GLGB_SHEON)

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (Biological process) GO:0005978 glycogen biosynthetic process процесс биосинтеза гликогена ISS
Молекулярная функция (Molecular function) GO:0003844 1,4-alpha-glucan branching enzyme activity 1,4-альфа-глюкановая активность разветвляющего фермента ISS

Таблица 2. Описание кодов достоверности, использованных в Таблице 1

Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Используется, когда основой для аннотации служит ручной анализ последователльности
In [ ]: