В данном задании нужно определить к какому КОГу относится данный белок WP_000742697.1. Для этого необходимо воспользоваться сервисом CDD, в поле поиска вставить последовательность белка в FASTA формате, а далее из списка найденных хитов выбрать хиты, относящие искомый белок к какому-либо КОГУ. В моем случае был найден только два таких хита (выдача).
COG1670 Protein N-acetyltransferase; interval 18-176 E-value 1.43e-13
COG0456 Ribosomal protein S18 acetylase RimI and related acetyltransferases; interval: 73-155 E-value: 8.76e-04
Для дальнейшей работы был выбран КОГ с меньшим E-value
Граф всех взаимодействий, который показывает STRING.
4На рисунках изображен графы, каждая вершина которых - совокупность белков (форм белка), транскрибируемых с одного гена. Размер узла отражает наличие (большой) иили отсутствие (маленький) 3D структуры белка в базе данных, она может быть или известной точно, или предсказанной.
Цвет ребер также имет смысл (Рис. 2)Розовые ребра отражают экспериментально доказанные взаимосвязи, голубые - взаимосвязи, информация о которых получена из курируемых баз данных. Ярко-зеленые ребра говорят о соседстве в геноме, красные - слияние генов, синие - совместную встречаемость. Светло-зеленые ребра означают совместное упоминание данных белков в Pub-Med, черные - коэкспрессию, а светло-синие - гомологию.
Для многих белков окружения наличиствует ко-экспрессия (рисунок ниже)
Так же было получено изображене соседства данного белка.
Из рисунков видно, что можно говорить о геномном окружении из двух элементов COG4264 и COG3486, соседство которых указано синими рамочками на рисунке соседства.
В данном задании помощью инструмента AmiGO поиском BLAST необходимо обнаружить БД GO белок, который наиболее похож на данный. E-value для находки равен 4.1e-17, достаточный для переноса терминов GO на данный белок.
Наилучшая находка - CJE_1508 cetyltransferase, GNAT family , принадлежит Campylobacter jejuni RM1221, т.е. не исходной бактерии
Данные выдачи:
Score = 210 (79.0 bits), Expect = 4.1e-17, P = 4.1e-17 Identities = 49/162 (30%), Positives = 88/162 (54%) Query: 10 IQAIDFTNLNDGEKLLVLEFRNHPNTALWMYSTFISLKTHLQFIEDLKNSPNHRYFL-FK 68 I+ +FT LN E L+ ++RNHP+ +M + +I + HL+F++ L + +YFL F+ Sbjct: 2 IKLKNFTELNSQEIELIFKWRNHPDINQFMKTKYIDFEEHLRFLKKLHQDSSKKYFLVFQ 61 Query: 69 EEGVYLGVGSITKINFFHKHGYLGIYKNPFLKNGGETILKALEFIAFEEFQLHSLHLEVM 128 +E + +G I +N K G+Y P LK G+ ++ + AFE ++++L V Sbjct: 62 DEQI---IGVIDFVNITTKSCEFGLYAKPNLKGVGQILMNEIIKYAFENLKVNTLKAYVF 118 Query: 129 ENNFKAIAFYEKNHYELEGRLKGFISKDKEFIDVLLYYKDKK 170 ++N KA+ Y++NH+ + +DK+F + L D K Sbjct: 119 KDNRKALKLYQQNHFTI-------YDEDKDFYHICLKQSDCK 153
Термины, ассоциированные с белком CJE_1508 acetyltransferase, GNAT family
Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
---|---|---|---|---|
Биологический процесс | GO:0008152 | metabolic process | Метаболический процесс | ISS |
Функция молекулы | GO:0008080 | N-acetyltransferase activity | Н-ацилтрансферазная активность | ISS |
Коды достоверности
Код типа довтоверности | Расшифровка кода типа достоверности | Объяснение |
---|---|---|
ISS | Inferred from Sequence or structural Similarity | Это код достоверности хороший и, как видно из названия кода, строит связи (т.е., например, относит найденный мной белок к какому-либо из терминов) на основе последовательностей. В ISS входят еще 3 типа: inferred from Sequence Orthology (ISO), inferred from Sequence Alignment (ISA), inferred from Sequence Model (ISM). |