Геномные окружения.

КОГ, к которому относится белок.

Для выполнения задания был выбран белок ADX55361.1 длиной 439 аминокислот. Поиск по базе консервативных доменов CDD/SPARCLE позволил отнести его фрагмент с координатами 160-429 к КОГ с идентфикатором COG0438 с e-value 1.43e-40. Англоязычное название этого КОГ - Glycosyltransferase involved in cell wall bisynthesis, а класс - M (Cell wall/membrane/envelope biogenesis). В переводе на русский это означает "Занятые в синтезе клеточной стенки гликозилтрансферазы" и "Биосинтез клеточной стенки/мембраны/внешней оболочки".

Геномное окружение

Данный КОГ не образует большого количества ассоциаций с другими КОГами, поскольку они в выдаче программы появляются только при пороге в 15% (COG1216, гликозилтрансфераза семейства GT2, отображен светлозеленой стрелкой). Вокруг генов, принадлежащих к данному КОГ(темнозеленый), часо наблюдаются другие гены представители исходного КОГ и гены работающих с углеводами и их метаболическими путями белков. Геномное окружение в этом отношении слабоконсервативное, много гипотетических белков, сигнальных пептидов а также белков клеточной системы сигнализации. Также стоит отметить, что встречаются несколько генов данного КОГа подряд, а также продукты слияния двух уже упомянутых КОГ.

Отнесения белка биосинтеза клеточной стенки из Burkholderia sp.

При поиске в базе данных GO методом BLAST был найден наиболее похожий белок с идентификатором GSU_2253 при P value 1.7e-17. Он относится к гликозилтрансфразе из группы первого семейства и принадлежит к протеому дельтапротеобактерии Geobacter sulfurreducens. По координатам выравнивания Ниже представлена выдача BLAST для этой находки. Белки обладают одинаковой доменной архитектурой, а выравнивание затрагивает С-конец N-концевого домена, междоменный регион и второй домен, значит структура, и как следствие функционал белков достаточно схожи, чтобы можно было экстраполировать термины GO одного белка на другой.

>TIGR_CMR|GSU_2253 
            symbol:GSU_2253 "glycosyl transferase, group 1 family
            protein" species:243231 "Geobacter sulfurreducens PCA" [GO:0000271
            "polysaccharide biosynthetic process" evidence=ISS] [GO:0016757
            "transferase activity, transferring glycosyl groups" evidence=ISS]
            InterPro:IPR001296 Pfam:PF00534 GO:GO:0009058 GO:GO:0016740
            EMBL:AE017180 GenomeReviews:AE017180_GR HOGENOM:HOG000077290
            RefSeq:NP_953302.1 ProteinModelPortal:Q74AU7 GeneID:2687490
            KEGG:gsu:GSU2253 PATRIC:22027361 OMA:DSWVGAI
            BioCyc:GSUL243231:GH27-2240-MONOMER Uniprot:Q74AU7
        Length = 371

 Score = 235 (87.8 bits), Expect = 1.7e-17, P = 1.7e-17
 Identities = 92/316 (29%), Positives = 139/316 (43%)

Query:   118 VLPGIVRQVRAIAARAQAFDMLFVNTQKALVLGALGKALHRKPVVWYQHDILTREHFGRV 177
             V P  +R    +  R +  D+++ ++ K   LG +   L   P+V       +RE    +
Sbjct:    73 VHPAALRSFCTVIRR-EGVDVIYSHSAKDSWLGGIASLLTGVPLV------RSRELLNPI 125

Query:   178 QLAVVKWAVRLAVDQVIVNSRASAKSLAALTGRAADTAPVVYNGIDASAFNCVDGTDMGM 237
             + A+   +  L   +V+  S A  + L A  G A     V Y  +  + F  V   +   
Sbjct:   126 KRAI---SYNLLPKRVLACSNAVREHLVA-AGVAPRKIRVQYPPVATARFASVTDEERLN 181

Query:   238 LRQRLGLPEHAWLAGLFGRLAPWKGQH--IALEALTR--LPDAHLVLVGAPLFGEDAYAQ 293
              R+ LGL  H  +          K Q   I   AL R   P A LVL G+       Y  
Sbjct:   182 TRRELGLDGHFPVIACVAGFRTEKRQEDLIRAMALIRRPFPSARLVLAGSGW-----YVA 236

Query:   294 RLRDEASALGIAERVHFAGFQDDIPAWMKAMNVILHTSTEPEPFGRVIVEGMAAGRPVIA 353
              LR  A   G+ + V   G ++D+PA +   +V +  S+  EPFG   VE MAAG PV+ 
Sbjct:   237 NLRSFAEEAGVTDLVDCPGEREDVPALLANTDVFVLPSSM-EPFGMSPVEAMAAGVPVVV 295

Query:   354 AAAGGVTEIVRHGRNGWLVKPGDAAVLADAIGVLRNDPALAQRLAQQALLDAQAEFSVDQ 413
                GG+ EIV  G +G  V  GD   +ADAI  + ND  L  RLA   L  A ++F   +
Sbjct:   296 TRTGGLAEIVTDGVDGIQVPVGDPPAIADAIIRICNDRQLRDRLAAAGLRRA-SDFDEAR 354

Query:   414 YVQRMMDALSKAVKRR 429
              ++ ++   +  + RR
Sbjct:   355 AIEALLGHFNDVIARR 370

Были также получены два термина GO, представленные в первой таблице. Коды типа их достоверности расшифрованы в таблице 2.

Таблица 1. Термины GO, отнесенные к белку с идентефикатором Uniprot Q74AU7 (Q74AU7_GEOSL)
АспектИдентификатор GOНазвание терминаПеревод названия терминаКод типа достоверности
Биологический процесс (biological process)GO:0000271 polysaccharide biosynthetic processПроцесс биосинтеза полисахаридовISS
Молукцлярная функция (molecular function)GO:00016757transferase activity, transferring glycosyl groupsТрансферазная активность: перенос гликозильных группISS

Таблица 2. Описание кодов достоверности, использованных в Таблице 1
Код типа достоверностиРасшифровка кода типа достоверностиОбъяснение
ISSInferred from Sequence or structural SimilarityВыяснено по схожести последовательностей(преимущественно) либо структур. Этот код используется если есть совокупность разнокалиберных свидетельств, не вписывающихся в его дочерние коды ISA, ISM и ISO. Запись с таким кодом была проаннотированна вручную.


© Бусыгин Сергей, 2018