Для выполнения задания был выбран белок ADX55361.1 длиной 439 аминокислот. Поиск по базе консервативных доменов CDD/SPARCLE позволил отнести его фрагмент с координатами 160-429 к КОГ с идентфикатором COG0438 с e-value 1.43e-40. Англоязычное название этого КОГ - Glycosyltransferase involved in cell wall bisynthesis, а класс - M (Cell wall/membrane/envelope biogenesis). В переводе на русский это означает "Занятые в синтезе клеточной стенки гликозилтрансферазы" и "Биосинтез клеточной стенки/мембраны/внешней оболочки".
Данный КОГ не образует большого количества ассоциаций с другими КОГами, поскольку они в выдаче программы появляются только при пороге в 15% (COG1216, гликозилтрансфераза семейства GT2, отображен светлозеленой стрелкой). Вокруг генов, принадлежащих к данному КОГ(темнозеленый), часо наблюдаются другие гены представители исходного КОГ и гены работающих с углеводами и их метаболическими путями белков. Геномное окружение в этом отношении слабоконсервативное, много гипотетических белков, сигнальных пептидов а также белков клеточной системы сигнализации. Также стоит отметить, что встречаются несколько генов данного КОГа подряд, а также продукты слияния двух уже упомянутых КОГ.
При поиске в базе данных GO методом BLAST был найден наиболее похожий белок с идентификатором GSU_2253 при P value 1.7e-17. Он относится к гликозилтрансфразе из группы первого семейства и принадлежит к протеому дельтапротеобактерии Geobacter sulfurreducens. По координатам выравнивания Ниже представлена выдача BLAST для этой находки. Белки обладают одинаковой доменной архитектурой, а выравнивание затрагивает С-конец N-концевого домена, междоменный регион и второй домен, значит структура, и как следствие функционал белков достаточно схожи, чтобы можно было экстраполировать термины GO одного белка на другой.
>TIGR_CMR|GSU_2253 symbol:GSU_2253 "glycosyl transferase, group 1 family protein" species:243231 "Geobacter sulfurreducens PCA" [GO:0000271 "polysaccharide biosynthetic process" evidence=ISS] [GO:0016757 "transferase activity, transferring glycosyl groups" evidence=ISS] InterPro:IPR001296 Pfam:PF00534 GO:GO:0009058 GO:GO:0016740 EMBL:AE017180 GenomeReviews:AE017180_GR HOGENOM:HOG000077290 RefSeq:NP_953302.1 ProteinModelPortal:Q74AU7 GeneID:2687490 KEGG:gsu:GSU2253 PATRIC:22027361 OMA:DSWVGAI BioCyc:GSUL243231:GH27-2240-MONOMER Uniprot:Q74AU7 Length = 371 Score = 235 (87.8 bits), Expect = 1.7e-17, P = 1.7e-17 Identities = 92/316 (29%), Positives = 139/316 (43%) Query: 118 VLPGIVRQVRAIAARAQAFDMLFVNTQKALVLGALGKALHRKPVVWYQHDILTREHFGRV 177 V P +R + R + D+++ ++ K LG + L P+V +RE + Sbjct: 73 VHPAALRSFCTVIRR-EGVDVIYSHSAKDSWLGGIASLLTGVPLV------RSRELLNPI 125 Query: 178 QLAVVKWAVRLAVDQVIVNSRASAKSLAALTGRAADTAPVVYNGIDASAFNCVDGTDMGM 237 + A+ + L +V+ S A + L A G A V Y + + F V + Sbjct: 126 KRAI---SYNLLPKRVLACSNAVREHLVA-AGVAPRKIRVQYPPVATARFASVTDEERLN 181 Query: 238 LRQRLGLPEHAWLAGLFGRLAPWKGQH--IALEALTR--LPDAHLVLVGAPLFGEDAYAQ 293 R+ LGL H + K Q I AL R P A LVL G+ Y Sbjct: 182 TRRELGLDGHFPVIACVAGFRTEKRQEDLIRAMALIRRPFPSARLVLAGSGW-----YVA 236 Query: 294 RLRDEASALGIAERVHFAGFQDDIPAWMKAMNVILHTSTEPEPFGRVIVEGMAAGRPVIA 353 LR A G+ + V G ++D+PA + +V + S+ EPFG VE MAAG PV+ Sbjct: 237 NLRSFAEEAGVTDLVDCPGEREDVPALLANTDVFVLPSSM-EPFGMSPVEAMAAGVPVVV 295 Query: 354 AAAGGVTEIVRHGRNGWLVKPGDAAVLADAIGVLRNDPALAQRLAQQALLDAQAEFSVDQ 413 GG+ EIV G +G V GD +ADAI + ND L RLA L A ++F + Sbjct: 296 TRTGGLAEIVTDGVDGIQVPVGDPPAIADAIIRICNDRQLRDRLAAAGLRRA-SDFDEAR 354 Query: 414 YVQRMMDALSKAVKRR 429 ++ ++ + + RR Sbjct: 355 AIEALLGHFNDVIARR 370 |
Были также получены два термина GO, представленные в первой таблице. Коды типа их достоверности расшифрованы в таблице 2.
Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
---|---|---|---|---|
Биологический процесс (biological process) | GO:0000271 | polysaccharide biosynthetic process | Процесс биосинтеза полисахаридов | ISS |
Молукцлярная функция (molecular function) | GO:00016757 | transferase activity, transferring glycosyl groups | Трансферазная активность: перенос гликозильных групп | ISS |
Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
---|---|---|
ISS | Inferred from Sequence or structural Similarity | Выяснено по схожести последовательностей(преимущественно) либо структур. Этот код используется если есть совокупность разнокалиберных свидетельств, не вписывающихся в его дочерние коды ISA, ISM и ISO. Запись с таким кодом была проаннотированна вручную. |