Мой белок - формат-тетрагидрофоллат лигаза ALX07041.1. Она имеет COG ID: COG2759. Точность отнесения велика, так как E-value составляет 0e+00. COG обнаруживается в интервале от 3 до 556 аминокислоты. Всего в белке 556 аминокислот. COG относится к категории F - Nucleotide transport and metabolism и называется Formyltetrahydrofolate synthetase. Категория в переводе - Нуклеотидный транспорт и метаболизм. Название - Формилтетрагидрофолат синтаза.
Рис.1: Геномное окружение COG2759.
Найденный в GO белок отличен от оригинального. Организм Carboxydothermus hydrogenoformans, которому он принадлежит, сходен с моим на всех уровнях таксономии выше порядка. P-Value находки равняется 4.1e-200. Видно, что белки обладают большими сходными участками, что говорит о их сходстве по структуре, доменной организации и сходстве функций.
>TIGR_CMR|CHY_2385 [details] [associations]
symbol:CHY_2385 "formate--tetrahydrofolate ligase"
species:246194 "Carboxydothermus hydrogenoformans Z-2901"
[GO:0000105 "histidine biosynthetic process" evidence=ISS]
[GO:0004329 "formate-tetrahydrofolate ligase activity"
evidence=ISS] [GO:0009086 "methionine biosynthetic process"
evidence=ISS] [GO:0009113 "purine nucleobase biosynthetic process"
evidence=ISS] [GO:0009257 "10-formyltetrahydrofolate biosynthetic
process" evidence=ISS] [GO:0015940 "pantothenate biosynthetic
process" evidence=ISS] UniPathway:UPA00193 HAMAP:MF_01543
InterPro:IPR000559 InterPro:IPR020628 Pfam:PF01268 PROSITE:PS00721
PROSITE:PS00722 GO:GO:0005524 EMBL:CP000141
GenomeReviews:CP000141_GR GO:GO:0004329 GO:GO:0009396 GO:GO:0035999
HOGENOM:HOG000040280 eggNOG:COG2759 KO:K01938 OMA:EIMAVLC
ProtClustDB:PRK13505 RefSeq:YP_361182.1 ProteinModelPortal:Q3A9K2
SMR:Q3A9K2 STRING:Q3A9K2 GeneID:3728149 KEGG:chy:CHY_2385
PATRIC:21277833 BioCyc:CHYD246194:GJCN-2384-MONOMER Uniprot:Q3A9K2
Length = 556
Score = 1937 (686.9 bits), Expect = 4.1e-200, P = 4.1e-200
Identities = 366/556 (65%), Positives = 445/556 (80%)
Query: 1 MLTDIQIAQSCKMKPITQVAAELGIDEEELELYGKYKAKLSDKLWERVKDRPDGKLVLVT 60
M +DI+IAQ K++PI ++A +LG+ E+++ELYGKYKAK++ +W+R+KDRPDGKL+LVT
Sbjct: 1 MKSDIEIAQEAKLEPIVKIAEKLGLTEDDIELYGKYKAKIAAHVWDRIKDRPDGKLILVT 60
Query: 61 AINPTPAGEGKTTTTVGLGQAMARIGKKAVIALREPSLGPVMGIKXXXXXXXYSQVVPME 120
AINPTPAGEGKTTTTVGLG A++R+GKK VIALREPSLGP G+K Y+QVVPME
Sbjct: 61 AINPTPAGEGKTTTTVGLGDALSRLGKKTVIALREPSLGPSFGVKGGAAGGGYAQVVPME 120
Query: 121 DINLHFTGDMHAITAANNLLSAAIDNHIQQGNELNIDVRQIIWKRAMDMNDRALRNIVVG 180
DINLHFTGD+HAIT A+NLL+A IDNHI QGNEL ID R+++W+R +D+NDRALR +V+G
Sbjct: 121 DINLHFTGDLHAITTAHNLLAAMIDNHIHQGNELGIDPRRVVWRRVVDLNDRALRKVVIG 180
Query: 181 LGGKANGVPREDGFQITVASEVMAVLCLSTGLMDLKERLGRILIGYTYDGKPVFAKDLKV 240
LGG A GVPRE GF ITVASE+MA+LCL++ LMDLKER RILIGYTYD KPV+A+DLK
Sbjct: 181 LGGPAQGVPRETGFDITVASEIMAILCLASDLMDLKERFNRILIGYTYDQKPVYARDLKA 240
Query: 241 NGAMALLLKDAIKPNLVQTLENTPAIVHGGPFANIAHGCNSIVATRLGLKLADYCITEAG 300
GAM +L+KDAIKPNLVQTLE+TPA VHGGPFANIAHG NSI+A ++ LKLADY +TEAG
Sbjct: 241 AGAMTVLMKDAIKPNLVQTLEHTPAFVHGGPFANIAHGTNSILADKIALKLADYLVTEAG 300
Query: 301 FGADLGAEKFFNIKCRYAGLKPDLVVLVATIRALKYNGGVKKENLGIENLPALEKGFVNL 360
FGADLGAEKFFN+ CR+AG KP VV+VAT+RALKYNGGV + L ENL ALEKGF NL
Sbjct: 301 FGADLGAEKFFNVVCRFAGFKPSAVVIVATVRALKYNGGVPRAELNKENLEALEKGFANL 360
Query: 361 EKHIENIRKFQVPLLVAINHFDTDSEAEIEYVKNRCKALNVEVAFSDVFSKGSEGGIELA 420
EKHIENI KF +P +VAIN F TD++AE+ ++ +A E A S+V++KG EGGIELA
Sbjct: 361 EKHIENIGKFGLPAVVAINRFPTDTDAELNKLRELIEATGAEFALSEVWAKGGEGGIELA 420
Query: 421 EKVVKLTETQKSNFKPLYDVNLSXXXXXXXXXXXXYGADSVNILPAAERAIKKIEELKMD 480
+KV+K+ E + +NF+ LYD+ + YGAD V AE+ + K EE+
Sbjct: 421 QKVLKVIEEKPANFRYLYDLEMPIKQKIETIAREIYGADGVVFTADAEKTLAKFEEMGFG 480
Query: 481 KLPICVAKTQYSLSDDPTLLGRPQGFVITVREIKLSSGAGFIVAITGDIMTMPGLPKVPA 540
+P+ +AKTQYSLSDDP LGRP GF ITVRE++ S GAGFIVAITGDIMTMPGLPK PA
Sbjct: 481 NMPVIMAKTQYSLSDDPNKLGRPTGFNITVRELRASVGAGFIVAITGDIMTMPGLPKRPA 540
Query: 541 AEKIDIDENGVITGLF 556
AE IDID +G ITGLF
Sbjct: 541 AEVIDIDADGKITGLF 556
Информация о найденном белке представленна в виде двух таблиц. Таблица в оригинальном виде приведена здесь. Ниже приведен перевод части таблицы для упрощения понимания (Таб.1).
Все термины, отнесённые к белку, имеют достоверность типа ISS. Достоверность типа ISS (Inferred from Sequence or structural Similarity) может также использоваться для структурного сходства с экспериментально охарактеризованными продуктами генов, определяемыми кристаллографией, ядерным магнитным резонансом или вычислительным прогнозированием.
| Термин (перевод) | Аспект | GO ID | Код типа достоверности |
| Процесс биосинтеза10-формилтетрагидрофолата | Биологический процесс | GO:0009257 | ISS |
| Процесс биосинтезагистидина | Биологический процесс | GO:0000105 | ISS |
| Процесс биосинтеза метионина | Биологический процесс | go:0009086 | ISS |
| Процесс биосинтеза пантотената | Биологический процесс | GO:0015940 | ISS |
| Процесс биосинтеза пуриновых нуклеотидов | Биологический процесс | GO:0009113 | ISS |
| Формиат-тетрагидрофолатная лигаза | Молекулярная функция | GO:0004329 | ISS |