Геномное окружение. База данных GO

Получение информации о КОГе, к которому относится ваш белок

В данном задании нужно определить к какому КОГу относится данный белок WP_000742697.1. Для этого необходимо воспользоваться сервисом CDD, в поле поиска вставить последовательность белка в FASTA формате, а далее из списка найденных хитов выбрать хиты, относящие искомый белок к какому-либо КОГУ. В моем случае был найден только два таких хита (выдача).

COG1670 Protein N-acetyltransferase; interval 18-176 E-value 1.43e-13

COG0456 Ribosomal protein S18 acetylase RimI and related acetyltransferases; interval: 73-155 E-value: 8.76e-04

Для дальнейшей работы был выбран КОГ с меньшим E-value

Визуализация геномного окружения

Граф всех взаимодействий, который показывает STRING.

4

На рисунках изображен графы, каждая вершина которых - совокупность белков (форм белка), транскрибируемых с одного гена. Размер узла отражает наличие (большой) иили отсутствие (маленький) 3D структуры белка в базе данных, она может быть или известной точно, или предсказанной.

Цвет ребер также имет смысл (Рис. 2)Розовые ребра отражают экспериментально доказанные взаимосвязи, голубые - взаимосвязи, информация о которых получена из курируемых баз данных. Ярко-зеленые ребра говорят о соседстве в геноме, красные - слияние генов, синие - совместную встречаемость. Светло-зеленые ребра означают совместное упоминание данных белков в Pub-Med, черные - коэкспрессию, а светло-синие - гомологию.

Для многих белков окружения наличиствует ко-экспрессия (рисунок ниже)

Так же было получено изображене соседства данного белка.

Из рисунков видно, что можно говорить о геномном окружении из двух элементов COG4264 и COG3486, соседство которых указано синими рамочками на рисунке соседства.

Отнесение белка WP_000742697.1 из Helicobacter pylori к терминам GO

В данном задании помощью инструмента AmiGO поиском BLAST необходимо обнаружить БД GO белок, который наиболее похож на данный. E-value для находки равен 4.1e-17, достаточный для переноса терминов GO на данный белок.

Наилучшая находка - CJE_1508 cetyltransferase, GNAT family , принадлежит Campylobacter jejuni RM1221, т.е. не исходной бактерии

Данные выдачи:

 Score = 210 (79.0 bits), Expect = 4.1e-17, P = 4.1e-17
 Identities = 49/162 (30%), Positives = 88/162 (54%)

Query:    10 IQAIDFTNLNDGEKLLVLEFRNHPNTALWMYSTFISLKTHLQFIEDLKNSPNHRYFL-FK 68
             I+  +FT LN  E  L+ ++RNHP+   +M + +I  + HL+F++ L    + +YFL F+
Sbjct:     2 IKLKNFTELNSQEIELIFKWRNHPDINQFMKTKYIDFEEHLRFLKKLHQDSSKKYFLVFQ 61

Query:    69 EEGVYLGVGSITKINFFHKHGYLGIYKNPFLKNGGETILKALEFIAFEEFQLHSLHLEVM 128
             +E +   +G I  +N   K    G+Y  P LK  G+ ++  +   AFE  ++++L   V 
Sbjct:    62 DEQI---IGVIDFVNITTKSCEFGLYAKPNLKGVGQILMNEIIKYAFENLKVNTLKAYVF 118

Query:   129 ENNFKAIAFYEKNHYELEGRLKGFISKDKEFIDVLLYYKDKK 170
             ++N KA+  Y++NH+ +         +DK+F  + L   D K
Sbjct:   119 KDNRKALKLYQQNHFTI-------YDEDKDFYHICLKQSDCK 153

Термины, ассоциированные с белком CJE_1508 acetyltransferase, GNAT family

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс GO:0008152 metabolic process Метаболический процесс ISS
Функция молекулы GO:0008080 N-acetyltransferase activity Н-ацилтрансферазная активность ISS

Коды достоверности

Код типа довтоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Это код достоверности хороший и, как видно из названия кода, строит связи (т.е., например, относит найденный мной белок к какому-либо из терминов) на основе последовательностей. В ISS входят еще 3 типа: inferred from Sequence Orthology (ISO), inferred from Sequence Alignment (ISA), inferred from Sequence Model (ISM).
Term 4

Main page


© Artemiy Polozhintsev (Артемий Положинцев) 2016