Мой белок - формат-тетрагидрофоллат лигаза ALX07041.1. Она имеет COG ID: COG2759. Точность отнесения велика, так как E-value составляет 0e+00. COG обнаруживается в интервале от 3 до 556 аминокислоты. Всего в белке 556 аминокислот. COG относится к категории F - Nucleotide transport and metabolism и называется Formyltetrahydrofolate synthetase. Категория в переводе - Нуклеотидный транспорт и метаболизм. Название - Формилтетрагидрофолат синтаза.
 
Рис.1: Геномное окружение COG2759.
Найденный в GO белок отличен от оригинального. Организм Carboxydothermus hydrogenoformans, которому он принадлежит, сходен с моим на всех уровнях таксономии выше порядка. P-Value находки равняется 4.1e-200. Видно, что белки обладают большими сходными участками, что говорит о их сходстве по структуре, доменной организации и сходстве функций.
>TIGR_CMR|CHY_2385 [details] [associations]
            symbol:CHY_2385 "formate--tetrahydrofolate ligase"
            species:246194 "Carboxydothermus hydrogenoformans Z-2901"
            [GO:0000105 "histidine biosynthetic process" evidence=ISS]
            [GO:0004329 "formate-tetrahydrofolate ligase activity"
            evidence=ISS] [GO:0009086 "methionine biosynthetic process"
            evidence=ISS] [GO:0009113 "purine nucleobase biosynthetic process"
            evidence=ISS] [GO:0009257 "10-formyltetrahydrofolate biosynthetic
            process" evidence=ISS] [GO:0015940 "pantothenate biosynthetic
            process" evidence=ISS] UniPathway:UPA00193 HAMAP:MF_01543
            InterPro:IPR000559 InterPro:IPR020628 Pfam:PF01268 PROSITE:PS00721
            PROSITE:PS00722 GO:GO:0005524 EMBL:CP000141
            GenomeReviews:CP000141_GR GO:GO:0004329 GO:GO:0009396 GO:GO:0035999
            HOGENOM:HOG000040280 eggNOG:COG2759 KO:K01938 OMA:EIMAVLC
            ProtClustDB:PRK13505 RefSeq:YP_361182.1 ProteinModelPortal:Q3A9K2
            SMR:Q3A9K2 STRING:Q3A9K2 GeneID:3728149 KEGG:chy:CHY_2385
            PATRIC:21277833 BioCyc:CHYD246194:GJCN-2384-MONOMER Uniprot:Q3A9K2
        Length = 556
 Score = 1937 (686.9 bits), Expect = 4.1e-200, P = 4.1e-200
 Identities = 366/556 (65%), Positives = 445/556 (80%)
Query:     1 MLTDIQIAQSCKMKPITQVAAELGIDEEELELYGKYKAKLSDKLWERVKDRPDGKLVLVT 60
             M +DI+IAQ  K++PI ++A +LG+ E+++ELYGKYKAK++  +W+R+KDRPDGKL+LVT
Sbjct:     1 MKSDIEIAQEAKLEPIVKIAEKLGLTEDDIELYGKYKAKIAAHVWDRIKDRPDGKLILVT 60
Query:    61 AINPTPAGEGKTTTTVGLGQAMARIGKKAVIALREPSLGPVMGIKXXXXXXXYSQVVPME 120
             AINPTPAGEGKTTTTVGLG A++R+GKK VIALREPSLGP  G+K       Y+QVVPME
Sbjct:    61 AINPTPAGEGKTTTTVGLGDALSRLGKKTVIALREPSLGPSFGVKGGAAGGGYAQVVPME 120
Query:   121 DINLHFTGDMHAITAANNLLSAAIDNHIQQGNELNIDVRQIIWKRAMDMNDRALRNIVVG 180
             DINLHFTGD+HAIT A+NLL+A IDNHI QGNEL ID R+++W+R +D+NDRALR +V+G
Sbjct:   121 DINLHFTGDLHAITTAHNLLAAMIDNHIHQGNELGIDPRRVVWRRVVDLNDRALRKVVIG 180
Query:   181 LGGKANGVPREDGFQITVASEVMAVLCLSTGLMDLKERLGRILIGYTYDGKPVFAKDLKV 240
             LGG A GVPRE GF ITVASE+MA+LCL++ LMDLKER  RILIGYTYD KPV+A+DLK 
Sbjct:   181 LGGPAQGVPRETGFDITVASEIMAILCLASDLMDLKERFNRILIGYTYDQKPVYARDLKA 240
Query:   241 NGAMALLLKDAIKPNLVQTLENTPAIVHGGPFANIAHGCNSIVATRLGLKLADYCITEAG 300
              GAM +L+KDAIKPNLVQTLE+TPA VHGGPFANIAHG NSI+A ++ LKLADY +TEAG
Sbjct:   241 AGAMTVLMKDAIKPNLVQTLEHTPAFVHGGPFANIAHGTNSILADKIALKLADYLVTEAG 300
Query:   301 FGADLGAEKFFNIKCRYAGLKPDLVVLVATIRALKYNGGVKKENLGIENLPALEKGFVNL 360
             FGADLGAEKFFN+ CR+AG KP  VV+VAT+RALKYNGGV +  L  ENL ALEKGF NL
Sbjct:   301 FGADLGAEKFFNVVCRFAGFKPSAVVIVATVRALKYNGGVPRAELNKENLEALEKGFANL 360
Query:   361 EKHIENIRKFQVPLLVAINHFDTDSEAEIEYVKNRCKALNVEVAFSDVFSKGSEGGIELA 420
             EKHIENI KF +P +VAIN F TD++AE+  ++   +A   E A S+V++KG EGGIELA
Sbjct:   361 EKHIENIGKFGLPAVVAINRFPTDTDAELNKLRELIEATGAEFALSEVWAKGGEGGIELA 420
Query:   421 EKVVKLTETQKSNFKPLYDVNLSXXXXXXXXXXXXYGADSVNILPAAERAIKKIEELKMD 480
             +KV+K+ E + +NF+ LYD+ +             YGAD V     AE+ + K EE+   
Sbjct:   421 QKVLKVIEEKPANFRYLYDLEMPIKQKIETIAREIYGADGVVFTADAEKTLAKFEEMGFG 480
Query:   481 KLPICVAKTQYSLSDDPTLLGRPQGFVITVREIKLSSGAGFIVAITGDIMTMPGLPKVPA 540
              +P+ +AKTQYSLSDDP  LGRP GF ITVRE++ S GAGFIVAITGDIMTMPGLPK PA
Sbjct:   481 NMPVIMAKTQYSLSDDPNKLGRPTGFNITVRELRASVGAGFIVAITGDIMTMPGLPKRPA 540
Query:   541 AEKIDIDENGVITGLF 556
             AE IDID +G ITGLF
Sbjct:   541 AEVIDIDADGKITGLF 556
Информация о найденном белке представленна в виде двух таблиц. Таблица в оригинальном виде приведена здесь. Ниже приведен перевод части таблицы для упрощения понимания (Таб.1).
Все термины, отнесённые к белку, имеют достоверность типа ISS. Достоверность типа ISS (Inferred from Sequence or structural Similarity) может также использоваться для структурного сходства с экспериментально охарактеризованными продуктами генов, определяемыми кристаллографией, ядерным магнитным резонансом или вычислительным прогнозированием.
| Термин (перевод) | Аспект | GO ID | Код типа достоверности | 
| Процесс биосинтеза10-формилтетрагидрофолата | Биологический процесс | GO:0009257 | ISS | 
| Процесс биосинтезагистидина | Биологический процесс | GO:0000105 | ISS | 
| Процесс биосинтеза метионина | Биологический процесс | go:0009086 | ISS | 
| Процесс биосинтеза пантотената | Биологический процесс | GO:0015940 | ISS | 
| Процесс биосинтеза пуриновых нуклеотидов | Биологический процесс | GO:0009113 | ISS | 
| Формиат-тетрагидрофолатная лигаза | Молекулярная функция | GO:0004329 | ISS |