Для выполнения задания был выбран белок ADX55361.1 длиной 439 аминокислот. Поиск по базе консервативных доменов CDD/SPARCLE позволил отнести его фрагмент с координатами 160-429 к КОГ с идентфикатором COG0438 с e-value 1.43e-40. Англоязычное название этого КОГ - Glycosyltransferase involved in cell wall bisynthesis, а класс - M (Cell wall/membrane/envelope biogenesis). В переводе на русский это означает "Занятые в синтезе клеточной стенки гликозилтрансферазы" и "Биосинтез клеточной стенки/мембраны/внешней оболочки".
Данный КОГ не образует большого количества ассоциаций с другими КОГами, поскольку они в выдаче программы появляются только при пороге в 15% (COG1216, гликозилтрансфераза семейства GT2, отображен светлозеленой стрелкой). Вокруг генов, принадлежащих к данному КОГ(темнозеленый), часо наблюдаются другие гены представители исходного КОГ и гены работающих с углеводами и их метаболическими путями белков. Геномное окружение в этом отношении слабоконсервативное, много гипотетических белков, сигнальных пептидов а также белков клеточной системы сигнализации. Также стоит отметить, что встречаются несколько генов данного КОГа подряд, а также продукты слияния двух уже упомянутых КОГ.
При поиске в базе данных GO методом BLAST был найден наиболее похожий белок с идентификатором GSU_2253 при P value 1.7e-17. Он относится к гликозилтрансфразе из группы первого семейства и принадлежит к протеому дельтапротеобактерии Geobacter sulfurreducens. По координатам выравнивания Ниже представлена выдача BLAST для этой находки. Белки обладают одинаковой доменной архитектурой, а выравнивание затрагивает С-конец N-концевого домена, междоменный регион и второй домен, значит структура, и как следствие функционал белков достаточно схожи, чтобы можно было экстраполировать термины GO одного белка на другой.
>TIGR_CMR|GSU_2253
symbol:GSU_2253 "glycosyl transferase, group 1 family
protein" species:243231 "Geobacter sulfurreducens PCA" [GO:0000271
"polysaccharide biosynthetic process" evidence=ISS] [GO:0016757
"transferase activity, transferring glycosyl groups" evidence=ISS]
InterPro:IPR001296 Pfam:PF00534 GO:GO:0009058 GO:GO:0016740
EMBL:AE017180 GenomeReviews:AE017180_GR HOGENOM:HOG000077290
RefSeq:NP_953302.1 ProteinModelPortal:Q74AU7 GeneID:2687490
KEGG:gsu:GSU2253 PATRIC:22027361 OMA:DSWVGAI
BioCyc:GSUL243231:GH27-2240-MONOMER Uniprot:Q74AU7
Length = 371
Score = 235 (87.8 bits), Expect = 1.7e-17, P = 1.7e-17
Identities = 92/316 (29%), Positives = 139/316 (43%)
Query: 118 VLPGIVRQVRAIAARAQAFDMLFVNTQKALVLGALGKALHRKPVVWYQHDILTREHFGRV 177
V P +R + R + D+++ ++ K LG + L P+V +RE +
Sbjct: 73 VHPAALRSFCTVIRR-EGVDVIYSHSAKDSWLGGIASLLTGVPLV------RSRELLNPI 125
Query: 178 QLAVVKWAVRLAVDQVIVNSRASAKSLAALTGRAADTAPVVYNGIDASAFNCVDGTDMGM 237
+ A+ + L +V+ S A + L A G A V Y + + F V +
Sbjct: 126 KRAI---SYNLLPKRVLACSNAVREHLVA-AGVAPRKIRVQYPPVATARFASVTDEERLN 181
Query: 238 LRQRLGLPEHAWLAGLFGRLAPWKGQH--IALEALTR--LPDAHLVLVGAPLFGEDAYAQ 293
R+ LGL H + K Q I AL R P A LVL G+ Y
Sbjct: 182 TRRELGLDGHFPVIACVAGFRTEKRQEDLIRAMALIRRPFPSARLVLAGSGW-----YVA 236
Query: 294 RLRDEASALGIAERVHFAGFQDDIPAWMKAMNVILHTSTEPEPFGRVIVEGMAAGRPVIA 353
LR A G+ + V G ++D+PA + +V + S+ EPFG VE MAAG PV+
Sbjct: 237 NLRSFAEEAGVTDLVDCPGEREDVPALLANTDVFVLPSSM-EPFGMSPVEAMAAGVPVVV 295
Query: 354 AAAGGVTEIVRHGRNGWLVKPGDAAVLADAIGVLRNDPALAQRLAQQALLDAQAEFSVDQ 413
GG+ EIV G +G V GD +ADAI + ND L RLA L A ++F +
Sbjct: 296 TRTGGLAEIVTDGVDGIQVPVGDPPAIADAIIRICNDRQLRDRLAAAGLRRA-SDFDEAR 354
Query: 414 YVQRMMDALSKAVKRR 429
++ ++ + + RR
Sbjct: 355 AIEALLGHFNDVIARR 370 |
Были также получены два термина GO, представленные в первой таблице. Коды типа их достоверности расшифрованы в таблице 2.
| Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
|---|---|---|---|---|
| Биологический процесс (biological process) | GO:0000271 | polysaccharide biosynthetic process | Процесс биосинтеза полисахаридов | ISS |
| Молукцлярная функция (molecular function) | GO:00016757 | transferase activity, transferring glycosyl groups | Трансферазная активность: перенос гликозильных групп | ISS |
| Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
|---|---|---|
| ISS | Inferred from Sequence or structural Similarity | Выяснено по схожести последовательностей(преимущественно) либо структур. Этот код используется если есть совокупность разнокалиберных свидетельств, не вписывающихся в его дочерние коды ISA, ISM и ISO. Запись с таким кодом была проаннотированна вручную. |